あぐりログのサーバ構成を見直します。

サーバ能力が限界点に近い

昨年の後半から、利用者が一気に増えた事は何よりも僕たちにとって、嬉しい出来事でした。
もっと増えて欲しいのも正直な所ですが。
そんな事よりも、現在のサーバ環境で、年末~正月は乗り切りましたが、先般トラブルシューティングで公開したように、サービスが停まってしまう事態に追い込まれてしまいました。
当日及びその後、状況調査しながら改善してきましたが、更に台数を増やしていくには、住まいを大きくするしか無いという結論になりました。

今後の進め方としては、

  1. ログBOXのファームウェアの更新アナウンスを行います。
  2. ログBOXのファームウェアの更新は、2/13~2/17にて実施します。
  3. この更新には、1/19の緊急対応処理ももちろん組み込みます。
  4. 2/27にデータベースサーバを移設するアナウンスを行います。
  5. 2/21~2/24 でデータベースサーバを移設する準備を行います。
  6. 並行してデータベースのリアルタイムなレプリケーションの準備を行います。
  7. 並行してレプリケーションサーバから定期的に社内サーバにバックアップする準備を行います。
  8. 2/27 11:00 にあぐりログのログイン画面を緊急メンテナンス画面に切り替えます。
  9. 復旧するまで、計測データはログBOXに蓄積される状態となります。
  10. データベースの移設完了後、ログBOXからのアップロードを再開します。
  11. ログBOXに蓄積されたデータアップロードが一通り終えたらログイン画面を復旧します。
  12. この間、4~5時間ほど要する予定です。

を予定しています。
シーズン中にサービスを一時停止することは、ご利用の皆様におかれましては、全く予期せぬことと思います。
シーズンに入る前に準備しておければ良かったのですが、後手に回ってしまいました。
これは、ユーザ数の増大に伴うサーバ負荷の見積が甘かったことの裏返しです。

これで改善するか。。

上記データベースサーバの移設で、これまで負荷が高かったサーバの負荷は軽減されます。
その状態で、再度負荷集中の状況を確認し、再度評価します。
おそらく、そこで未だ残る負荷を発見できると考えています。

データベースサーバ移設を終えたことで、次の見直しはサービス停止を伴わずに実施できるように手順を考えています。

農業においてデータを採集し、それを活用することは今後当たり前になっていくと考えています。
今の状態を見る。。
お知らせメールが飛んでくる。
等など

その為にも、当たり前が突然見えなくなる事態を無くすように、改善していきます。

皆様のご理解とご協力をお願いする次第です。
m(_ )m
m(
)m
m(
_)m