ICH9RのRAID破壊と復旧方法

RAIDが壊れたらどのように通知・表示されるのか?
またどのように復旧すれば良いのか?

ということで実際にRAIDを壊して実験してみました。


まずは構成から

構成

2本のデータディスクをICH9Rに繋いでRAID0ボリュームとRAID1ボリュームを構成。
ICH9Rはデータディスク専用にしてその他のドライブはGIGABYTE-SATA2側にまとめてある。
マザーボードGA-EP35-DS3Rを使用。

接続は以下の通り。

[ICH9R]
PORT-0: HGST HDT722516DLA380(データ用) → ここが壊れた、という想定
PORT-1: HGST HDT722516DLA380(データ用)
PORT-2: なし
PORT-3: なし
PORT-4: なし
PORT-5: なし

[GIGABYTE-SATA2]
PORT-0: Seagate ST3320620AS(システム用)
PORT-1: なし
IDE-Primary: DVDマルチ
IDE-Secondary: なし

RAID構成: 153.4GB x2本
volume0: RAID0 100GB(50GB+50GB)
volume1: RAID1 103.4GB(103.4GB+103.4GB)

想定する故障

ICH9RのPORT-0に接続されたディスクの故障。

PCを停止した状態でICH9RのPORT-0のSATAケーブルを抜き、仮想的に壊れた状況を作る。
その後電源を入れる。


故障時の状態

BIOSの状態
Volume0(RAID0)のStatusがFailed、
Volume1(RAID1)のStatusがDegradedになっている


Volume0(RAID0)は利用できない状態
Volume1(RAID1)は冗長性が無いが利用はできる状態
エクスプローラの状態
Fドライブ(RAID0)は見えなくなっている
Gドライブ(RAID1)は見える。アクセスもできる
Intel Matrix Storage Managerのポップアップメッセージ
冗長性が無くなったのでディスクを交換する必要がある、というメッセージがポップアップで表示される

これはRAID1ボリュームに対するメッセージになる
Intel Matrix Storage Managerの状態
Volume0の状態(ステータス: 失敗)
Volume1の状態(ステータス: 低下)
ディスクの状態(PORT-1)
ディスクの状態(PORT-0)

※PORT-0とは表示されないので、どのディスクが壊れたのかは他のポートの利用状況から判断する必要がある
PORT-0の状態

RAID1ボリュームの復旧

RAID1を復旧するには、壊れたディスクを同じ型番のディスクと交換する。
メーカー、型番が違うと同じ容量のディスクでも容量に細かい差異があり、利用できない可能性がある。

同じ型番のディスクが用意できない状況では、データのバックアップを取って新しいディスクでRAIDを組み直した方が良いだろう。


ディスク交換は通常電源OFFの状態で行うが、ICH9Rはホットスワップをサポートしている。
リムーバブルケースやエンクロージャホットスワップ可能な構造であれば、電源ONのままでも交換でき、
RAIDのメリットである高可用性(無停止での運用)の恩恵を最大限に享受できる。


故障していない方のディスクを取り外すと笑えない状況になるので、ケーブル接続と対象のディスクは予めよく確認しておく必要がある。接続ポートが分かるようにラベルを貼っておくと良い。


では先程外しておいたPORT-0のSATAケーブルを起動中に挿してみよう。

Intel Matrix Storage Managerのポップアップメッセージ
SATAケーブルを接続した直後にディスクが認識される
Intel Matrix Storage Managerの状態
PORT-0のディスクが認識されている
Volume1(RAID1)の再構築が自動的に始まる

完了までに1時間ほどかかった

データ破壊のおそれがあるので再構築中は再起動しないこと
ポップアップでも通知される

RAID0ボリュームは復旧できるか?

ディスクが壊れた場合は当然復旧できない。


たまたまケーブルが抜けただけだったり、別のPCに接続し直した場合はデータそのものは無事である。
この場合はIntel Matrix Storage Managerからボリュームの復元を実行してRAID0ボリュームを復旧できる。
また、応用で別のマザーボードのICH9Rに接続した場合に同じ方法でRAID0ボリュームを認識できる。(追記:データドライブをICH10Rに移行することはできた)

ボリュームの復元を実行する
- 元々ボリュームの一部であったハードドライブが再度挿入されている
- システムからそのハードドライブが取り外されていた間、ハードドライブのデータにアクセスされていない

以上の条件を満たしていることを確認して次へ進む
ボリュームの確認にはしばらく時間がかかる
完了
Fドライブ(RAID0)が見えるようになった

RAID0とRAID1のメニューの違い

RAID0とRAID1でメニューは若干異なり、RAID1だけ修復ができるようになっている。

Volume0(RAID0)のメニュー
Volume1(RAID1)のメニュー


以上で今回の実験は終了。