【障害報告】2018.5.24発生:/gs/hs0 障害

2018.5.25

 下記の通り障害が発生し仮復旧しました。

1.概要

 /gs/hs0の一部に一時的にアクセス不可、仮復旧後はパフォーマンスが低下している可能性あり。

2.期間

 2018年5月24日(木)19:18頃 から 19:36頃(仮復旧時刻)

3.詳細

 5/24 19:18 頃に Lustre (/gs/hs0 )のOSTを管理するossa3サーバでpanicが発生し、/gs/hs0 に一時的にアクセスできない状況が発生しました。19:36頃ossa2にテイクオーバーされ、現在は/gs/hs0は使用可能ですが、該当時間前後に一時的にlustreファイルシステムへのI/Oがストールしたと思われます。現在はossa3が担当するOSTがossa2にマウントされておりますので、/gs/hs0へのI/O帯域幅が低下する可能性がございます。