Topパソコンの部屋 ≫ ハードディスクが壊れたら - RAID-1(ミラーリング)

ハードディスクが壊れたら

RAID-1(ミラーリング)


ハードディスクは消耗品です。 常に故障の危険があり、故障すれば保存したデータは実質的に復旧不可能となります。 故障の前兆が見られた場合にはデータの保護も可能ですが、突然動作しなくなる場合もあり、データ保護の措置を取っていなければ被害は甚大です。

私自身、騒ぎとなった富士通 MPG-3409AT(40GB)を使用していてデータを失いました。 ファイルがたまってきたので整理をしていた最中の故障で、大変ショックでした。

この事件が RAID を導入するきっかけになりました。
ミラーリングのよくある質問

1.ミラーリングには同じ型番のハードディスクが必要ですか?
 同じ型番のハードディスクでなくても利用は可能です。筆者はメーカー、容量とも異なるハードディスクでミラーリングをしていたことがありますが、問題は起こりませんでした。ただし同じ型番のハードディスクを使った方が問題が発生しにくいと考えられますので、可能であれば同じ型番のものを使った方が安心だと思います。

2.ミラーリング中に一方のハードディスクが壊れるとどうなりますか?
 問題なく運用を続けられます。壊れたハードディスクは早めに新しいものと交換しましょう。

3.ハードディスクが壊れた時はどうすればよいですか?
 おすすめは壊れたハードディスクを新しいものと交換後、新しいハードディスクをスペアドライブに指定する方法です。システムはスペアドライブを見つけると、既存のハードディスクと新たに見つけたスペアドライブでミラーを構築します。交換に先立ってアレイの削除(ミラーリング設定の解除)をしてしまうとミラーの構築が行われなくなるので注意が必要です。
スペアドライブについてはフォーマットをする必要はありません。

4.ミラーリングのデメリットはありますか?
 同じ内容を二重に保存することになるため使える容量が半分になること、必要なドライブ数が二倍になることのほか、ミラーリングの仕組みをよく理解しておかなければならないことです。理解が充分でないと思わぬことでデータを失ってしまう危険があります。

5.システム(OS)をインストールしたハードディスクのミラーリングはできますか?
 可能です。

6.ミラーリングしていればバックアップはしなくてもよくなりますか?
 バックアップはしないといけません。ミラーリングはハードディスクの機械的な故障にしか対応できません。
以下は内容が古くなっている部分が多々あります。
物理的 ・ 論理的障害

「ハードディスクの内容が読めない」場合、原因は二つ考えられます。 物理的な障害と論理的な障害です。 物理的な障害とはハードディスク自体の機械的な故障を、論理的な障害とはハードディスク自体に問題はなく、記録したデータに論理的矛盾が発生してデータを取り出せなくなった状態です。

物理的障害の場合では個人レベルでのデータの復旧は絶望的ですが、論理的障害の場合にはデータの復旧が可能である事があります。
(→ 壊れた時に出来ること

RAID-1 は前者のハードディスクの機械的な故障による物理的障害にそなえるためのシステムです。
RAID-1(ミラーリング)

RAID-1 はハードディスクの物理的障害による運用停止に対して二重化で対抗するシステムです。 つまり同じ内容のハードディスクを2台持つことで故障にそなえようというものです。 故障にそなえることで結果的にデータの保護にも資することになりますが、論理的障害には無力で、RAID-1 によってすべての問題が解決するわけではありません。

RAID-1 は同じ内容のハードディスクを2台持つことになりますが、OS からは1台のハードディスクに見えるようになっています。 したがって RAID-1 導入後も見かけ上の変化はありません。
RAID-1 導入

RAID には RAID-0 から RAID-5 の6種類、さらにハードウェア RAID とソフトウェア RAID があります。 信頼性はハードウェア RAID が、また、SCSI ドライブを使用するものが高いとされています。 今回はハードディスクの故障に対する耐性を高めることが目的で高速性は必要なかったため、安価に導入できる IDE RAID-1 を導入しました。

用意したもの
 IDE RAID ボード(PCI)、 IDE HDD、 HDD アクセスランプ(LED)

RAID ボードは玄人志向の ATA133RAIDPCI を用意しました。 理由は最も低価格で入手できることと、ボード自体は BUFFALO(旧メルコ)の IFC-AT133RAID と同じものだと言われていたためです。

ATA133RAIDPCI は2チャンネル4台のハードディスクが接続でき、それぞれのチャンネルに HDD アクセスランプが接続できるようになっていますので、アクセスランプも用意しました。

アクセスランプは 3.5 インチベイのパネルに取り付けました。 穴をあけた後、ホットボンドで固定しています。 左2つが今回取り付けた ATA133RAIDPCI のプライマリ、セカンダリのアクセスランプ、右側は SCSI 用です。

LED は丸の方がパネルを加工しやすいかもしれません。 穴をあけるだけで済みますし、ドリルがあれば簡単です。
  LED

RAID-1 に使うハードディスクは同じ容量のものを用意します。 異なる容量のドライブを使用した場合には、利用できる容量は小さい方の容量になります。

ドライブの取り付けは通常の IDE ハードディスクの取り付けと同じです。 違いはマザーボードにケーブルを接続するのではなく、PCI ボードに接続する事ぐらいでしょう。

ATA133RAIDPCI はNT系OS(Windows2000 など)において HDD 2台のみを接続してミラーリングする場合、同じチャンネルのマスター/スレーブに接続しないと正常に動作しないようです。
RAID-1 でドライブが故障した時は

RAID-1 で運用中のドライブが故障した場合には、壊れた方のドライブが自動的に切り離されます。 もちろん切り離されるといっても論理的に切り離されるだけで、ケーブル類が切り離されるわけではありません。 故障したドライブは無いものとして扱われ、もう一方のドライブに対してのみ読み書きが行われるようになります。 したがってドライブの故障が発生しても通常通りの運用が可能です。

下は実際にドライブが故障した時のログです。 2003年9月4日、プライマリーマスターのドライブが故障し、切り離されたことがわかります。
04-September-2003 16:37.13
 SiICfg Event Logger Started
04-September-2003 16:37.13
 SiICfg Event writer starting up.
04-September-2003 17:11.22
 Warning - Member dropped ← ここで切り離し
 Set 0 dropped member 0 on adapter 0 due to a port error. SRB status was Request Timed Out.

 * SRB : SCSI Request Block

SRB status の Timed Out
SRB status のタイムアウトが起こってもドライブが故障したとは限りませんが、タイムアウトが頻発するような場合は何らかの問題があるものと考えられますので注意が必要です。
ミラーリングはドライバ仕様書によると次のような動作をしていると書かれています。
 1.読み書きの要求を受け取る
 2.受け取った読み書き要求のコピー(SRB)を2個作る
 3.それぞれのドライブに対してコピーした読み書き要求を送る(チャイルドプロセス)
 4.それぞれのドライブから正常終了のステータスを受け取る
 5.元の読み書き要求に対して正常終了のステータスを返す
SRB status のタイムアウトは4の段階でドライブから正常終了のステータスを一定時間内に受け取れなかった場合に起こります。つまり故障ではなくても何らかの理由で正常終了のステータスが遅れればタイムアウトとなります。
一方のドライブが故障してミラーが壊れた状態になった場合、RAID-1 のセットを早急に復旧させておく必要があります。 このままの状態で運用を続け、もう一方のドライブまで故障してしまってはミラーリングを導入した意味がなくなってしまいます。

RAID-1 のセットを復旧させる方法はいくつかあると思いますが、私はスペアドライブの割り当て機能を利用して復旧させています。 スペアドライブとはあらかじめ接続しておく予備のドライブのことで、故障が発生した時に自動的にその予備ドライブを使ってミラーの復旧が行われます。
本来はあらかじめ予備のドライブを接続しておいて利用する機能ですが、一方のドライブが故障してからでも利用できます。 手順は
1.故障したドライブを取り外す
2.新しいドライブを取り付ける
3.2で取り付けたドライブをスペアドライブに指定する
で終了です。 こうすれば自動的にスペアに指定したドライブがミラーリングに使われます。 この時新しいドライブの容量は現在使用中のドライブ容量と同じかそれ以上のものでなければならないのは言うまでもありません。

(参考)復旧方法の違いによるミラーの可否例 (数値は容量)
復旧方法可否現在のドライブ確保してある領域追加ドライブ
新規10095100
新規×10095 99
スペア10095 99
 (注)システムによって異なる場合があります。
RAID-1 導入のメリット ・ デメリット

デメリット
 1. ドライブ2台が1台分としてしか使えない (コストの問題)
 2. 接続するドライブ数が多くなる (内蔵スペース、排熱、電源の問題)

メリット
 1. ドライブが故障してもデータ消失がない
 2. 復旧作業がきわめて簡単で、ドライブが故障しても使用不能になる期間がない
 3. OS を再インストールする際、同じ内容のドライブがあるためデータ退避の必要がない

RAID-1 を導入すればデータ保護については万全というわけではありません。 しかし、それなりのメリットはあると思います。 ドライブの機械的故障に対する不安はほぼ考えなくても済むほか、システムドライブが故障した際には必要となる OS の再インストールの必要がなく、またそのことによる使用不能になる期間も発生しません。

個人的には、データの保険料として妥当な線ではないかと思います。

参考 壊れた時に出来ること

ハードディスクがおかしい、あるいは壊れた時に出来る対処法を考えてみました。
なお、ここに書いたことは一般論としての話であって、実際の対処法は個々のケースによって違ってきます。

物理的な障害の場合

ハードディスクから異音がするなどの症状が出た場合、すぐにバックアップを取ります。 この時パソコンの電源を切ったりリセットしたりしない方が良い場合があります。 ハードディスクを一度止めてしまうと再び動かないということがあるためです。 出来るだけそのままの状態で作業を行います。
ハードディスクに負担のかかるような行為(スキャンディスクなど)は行ってはいけません。

ハードディスクから異音がして内容を読み出せず、作業が出来ない場合はいったん電源を切ります。 ハードディスクが充分冷えるぐらいの時間をおいて電源を入れると、一時的に復旧する場合がありますのでその時にバックアップを取ります。
対象のハードディスクが起動ドライブの場合、別のドライブを起動ドライブとして OS を起動した方が負担が少なくなりますので、可能であれば別途起動用ドライブを用意した方が良いと思います。

ハードディスクが全く認識されない場合は、壊れたハードディスクの基板を同型のハードディスクの基板と交換することで復旧する場合があります。 これはハードディスクの基板に問題が起こって読み書きが出来ない場合に限り有効です。 ハードディスク内部の回路に問題が起こっている場合にはこの方法では復旧できません。

ハードディスクの物理的障害の対処法としてもうひとつ言われている方法に、冷凍庫で冷やすというのがあります。 冷えた状態だとドライブが一時的に認識されることがあるらしく、冷えた状態のままですばやく作業します。 またこれとは別に冷凍庫で冷やした後常温に戻す方法もあるようです。 読み取りヘッドが内部でくっついてしまった時にこうすると離れることがあるということのようです。 いずれにしても他に方法がない場合には試してみてもよいかもしれません。

*冷却の方法はこれまで試す機会がなかったので筆者は実行したことがありません。



論理的な障害の場合

突然「ディスクがフォーマットされていない」とメッセージが出たり、ハードディスクに複数の領域(パーティション)を割り当てていたのに見えなくなった、フォルダにアクセスできなくなったなどの場合は論理的な障害の可能性があります。 そのほか、クロスリンクやロストチェーンなどの発生も論理的な障害です。

論理的な障害の場合、データ復旧ソフトを使うのが一般的と思います。 ここで重要なことはデータ復旧ソフトを使うことです。 決してディスクのエラー修正ソフトを使ってはいけません。 たとえばスキャンディスクはエラーを修正するソフトであるため、不都合のある部分はすべて切り捨てる方向で作業が行われます。 そのため、いったんスキャンディスクを使ってしまうとデータ救済は不可能になってしまいます。 ノートンディスクドクターも同様だと言われています。(注:2004年現在)

論理的な障害が発生した場合、まずあわてないことが大切です。 そして障害が発生したドライブには書き込みやファイルの削除など、ディスクの内容を変更する作業は一切行ってはいけません。 そういったことをしてしまうと状態をさらに悪化させてしまうからです。 そのままの状態を保ったままデータ復旧ソフトに任せるのが一番だと思います。

データ復旧ソフトを使うと誤って削除してしまったファイルやパーティションも復旧させることが出来る場合がありますので、そういった時にも有効だと思います。

起動用のハードディスクの領域(パーティション)が見えなくなった時、スレーブにつなぎなおして別のハードディスクから起動するとファイルを読めるようになることがあります。 「うまくいけば儲けもの」程度に試してみてもよいかと思います。
関連リンク
ソフトウェア
 データ復元ツール FINALDATA (AOS テクノロジー)
 Disk Salvage Tools (松田さん)
復旧サービス(おすすめするわけではありません)
 データリカバリー フィーダーサービス
 メゾネット・データサルベージ 福澤商店


富士通のハードディスク用ツール(2011/3 現在)
富士通が無償配布していたハードディスク用ツール類は、下記の東芝のサイトから入手できるようになっています。
Software Utilities
http://sdd.toshiba.com/main.aspx?Path=ServicesSupport/FujitsuDrivesUSandCanada/SoftwareUtilities
東芝に移る前の配布元だった富士通のページ(今は存在しません)
http://www.fujitsu.com/us/services/computing/storage/hdd/support/utilities.html
http://www.fis.fujitsu.com/home/drivers.asp?L=en&CID=1


Back

24 Apr 2004
Last Modified: 30 Dec 2011