緊急メンテナンス完了のご連絡

平素よりGPUSOROBANをご利用いただきありがとうございます。
GPUSOROBANの緊急メンテナンスが完了しましたのでご連絡いたします。

今回のメンテナンスでは、3/14 19:00~3/15 11:00の通信障害および、3/15 11:00~3/19 15:00 の管理クラスタ停止の2つの障害の対応を行い、現在は復旧が完了しています。
長時間のサービス中断を伴うメンテナンスとなり、ご利用中のお客様には多大なご迷惑をおかけし誠に申し訳ありませんでした。

メンテナンス内容は以下となります。
尚、今回発生した2つの障害には関連性がないと判断しております。

*1.  3/14 19:00 ~ 3/15 11:00 通信障害
現象:
・利用者からインスタンスへアクセスできない
・GPUSOROBAN Webコントロールパネルの機能が利用できない

影響:全インスタンス

原因:特定機器の動作不具合

対応:ネットワークから該当機器を隔離(該当機器の障害原因は調査中です。)

*2.3/15 11:00~3/19 15:00 
現象:GPUSOROBANサービスの中断

影響:全サービス(個別提供のベアメタルインスタンスを除く)

原因:GPUSOROBANのインフラの内部的な管理機能を提供するクラスタは3台の冗長構成で稼働しています。
今回はそのうち2台のクラスタ・ノードにおいてSSDの故障が発生したことにより、クラスタがダウンしました。
そのためGPUSOROBANインフラの管理機能が停止し、サービスが中断しました。

対応: ダウンした2台のクラスタ・ノードのうち、いずれか1台の復旧作業を試みました。
複数の手法で作業を試みましたが、復旧には至りませんでした。
そのため復旧プランを切り替え、残りのクラスタ・ノード1台からクラスタ全体を復旧する作業を実施しました。

ご案内:ご利用中のインスタンスのIPアドレスが変更されている場合がございます。
接続作業前にWebコントロールパネルでの確認をお願い致します。

この度は多大なご迷惑をおかけしたこと、深くお詫び申し上げます。
事象の再発防止のため、改善や修正に取り組んで参ります。

本情報についてのお問い合わせはGPUSOROBANお問い合わせ窓口宛にお願い致します。

今後ともGPUSOROBANをよろしくお願い致します。