あぐりログサービスのトラブル対応について

2017/1/19 あぐりログサービスにトラブルが発生しています

本日、AM4時過ぎからあぐりログのデータサービスを行っているサーバの負荷が急激に上がり、データ登録および閲覧向けのデータ検索サービスが滞る状態に陥りました。
あぐりログをご利用の皆様および利用者の方々をサポート頂いているJAさんや普及所等の方々にはご迷惑をおかけしています。
今年に入って、2回目のサーバトラブルです。
前回は、1/12で発生時刻はほぼ同じでした。
まことに申し訳ない次第です。

発生時刻にからむサーバ負荷増大要因は、先日から調査継続しており、その点で原因究明できた状態には未だ達していません。
現在は、データベースやWebサーバの設定見直しで運用を行っているのが正直な所です。

現状をどうするか

まずは、安定したサービス維持が喫緊の課題です。
あぐりログはモニタリングを基本サービスとしています。データを見ることができる事で安心を提供できるものです。
ログBOXがインターネットに接続している限りは、最新データを提供できるように安定化を図ります。

そして、皆様にサーバトラブルであることを伝える手段の確立です。
現在のトラブル発生時に皆様に通知されるメッセージは、

あぐりログ/あぐりナビ メール通知サービス

設備に異常が発生しています。

異常内容
ログBOXからの計測が途切れています。すぐ復旧しない場合はログBOX本体電源を入れ直してみて下さい

というもので、ログBOX側に問題がある旨を通知してしまっています。
これは正しいアラートではありません。
これを以下のように見直す必要があります。

  • サーバに問題があると正しく伝えること
  • 計測データはログBOXに蓄積されていること
  • サーバの復旧連絡を行うこと

今すぐに修正という訳にはいきませんが、極力早い時期に改修できればと思います。

今後どうするか

より安定化を図るために、サーバ増強をどこかで実施する必要があると考えています。
できる限り、ご利用に不便の無い手順を検討しています。

もう少し、調査検討を進めてご報告できるようにします。