信頼性向上のための取り組み(クラウドを利用した多重化、監視)

安定して稼働するからこそ、構築時の仕様検討や、業務運用に集中できる。

そのために、下記のように考え、取り組んでいます。

多重化設計による信頼性の向上

  • 複数拠点での多重化
  • 拠点内設備の多重化
  • サーバ類は常時自動監視しており、障害を検知した場合は自動的にサービスから切り離し、継続運転します。
  • その後、担当者が復旧作業を行います。

弊社にてサーバの監視/定期メンテナンスを実施。

  • 負荷状況のモニタリングと対応を適宜実施。
  • サーバメンテナンスも、サービス無停止で行っています。

— 事前対策、危険予知

負荷状況などは常に自動モニタリングしており、異常発生時は5分程度で担当者に通知が届きます。 また、異常が発生していない場合も、中長期傾向を把握するために、毎日、担当者が推移を確認しています。 早めに傾向を掴むことで、問題が発生する前に対策の検討、実施ができるように取り組んでいます。

TokyoFloor インフラ構成図

障害発生時の対応

万全を期したつもりでも、何かしらの障害が発生する可能性があります。 ハードウェアの故障、ソフトウェアのバグ、作業ミスなどです。

— ハードウェア障害

多重化しているため、障害発生時は片系運用している間にすみやかに復旧作業を行います。

— CMSプログラムの障害

弊社で開発、運用しているため、他社に依存せずすみやかに対応します。

— コンテンツ、データの障害

  • データベースは常時バックアップを取っています。
  • これとは別に、日ごとのバックアップも取得しています。
  • 誤操作などで、履歴を含めてデータを消してしまった場合は、過去のバックアップからデータを抽出することができます(手動対応)。