データ復旧:トップ > メディア解説 > RAIDの障害・故障
RAID構成はRAID0(ストライピング)を除き、ハードディスク(HDD)に冗長性を持たせているため、RAID構成内の一部のHDDが破損したとしても、他のHDDのデータから再構築(リビルド)することが可能です。
ただし、HDD以外の部品が故障した場合は、再構築が行えない場合もあります。電源や基盤、コントローラーそのものが故障した場合などはメーカー等へ修理を依頼する必要があります。その際にはデータが消える可能性がありますので、事前にデータ復旧企業へ依頼されたほうが良いケースも多くあります。
特に基盤やコントローラーが故障した場合は、RAID構成自体に問題が発生していなくても、そういった部品を交換することでRAIDの再構築や初期化が行われることがあるため、HDD以外の部品を交換するだけの処置でもデータが消える可能性があります。
また、RAIDを構成しているサーバーやNAS、外付けHDDから警告音が鳴っている場合、ディスクの破損によるエラーやRAIDが崩壊している場合があります。 例えば、TeraStation(テラステーション)であれば、エラーランプや本体前面の液晶ディスプレイで問題の発生したHDDを確認することが出来ます。 ただし、エラー表示が無かったディスクにも顕在化していない不具合があり、リビルド中に障害が発生して起動できなくなるケースがあります。 その為、ディスクエラー表示等がある場合には、全てのディスクをチェックすることをおすすめします。
RAID5では冗長データを1種類、RAID6では2種類作成し、それらを複数のハードディスクに分散させて記録させています。そのためRAID5では構成するHDDの任意の1台、RAID6では2台が破損した場合でも、残りのHDDに記録されているそれぞれの冗長データを組み合わせることでデータの再構築が可能となります。
RAIDの再構築は通常は専用のプログラムが用意されており、破損したHDDを交換後、コントローラーを介してほぼ自動で行われますが、分散している冗長データを繋ぎ合わせる処理が多数発生するので非常に時間がかかります。またその再構築中に、他のHDDにも破損が生じたり、コントローラー側に問題が発生するなどで再構築の最中にトラブルが発生することもよくある(データレスキューセンターに依頼があるRAID復旧のケースでよくあるパターンです)ので注意が必要です。
特にRAID構成では、ほぼ完全同一なHDDを同一条件・同一環境で使っていることが多く、そのためHDDの故障時期、タイミングが重なることがよくあります。再構築中のトラブルは致命傷になることも多いため、再構築作業を実施する際にはデータのバックアップを取った上で、コントローラーや電源、温度などの環境、構成する他のHDDのエラー状況等に十分に配慮する必要があります。
障害の程度・状況が特定できない場合は、安易にデータの再構築を実行するのは非常にリスクが高いため、そういった場合は何もせずに、データレスキューセンターをはじめとするデータ復旧企業にご相談いただくことをお勧めします。
構成する複数台とも全く同じ内容のHDDのため、全てが同時に破損する確率は低く、また互いが完全な代役になるので、RAIDコントローラーが故障した場合などでも短時間での復旧が可能となります。
障害発生時は該当のHDDを交換し、RAIDの再構築を実施する必要があります。ただし障害発生の原因が特定できない場合は、一台だけの状態からでもそのままアクセスが出来ることも多いので、一旦バックアップをおこなってから作業をすることを推奨します。ただし、片方が物理障害を発生した際にそれに巻き込まれる形で、もう片方のHDDのファイルフォーマット等が破損するというようなケースもよく見受けられます。こういったトラブル発生の際は再構築を実施することで余計に破損が広がることもありますので、そういった場合は何もせずにデータレスキューセンターなどのデータ復旧サービスにご相談ください。
構成するHDD全てにデータを分散して書き込んでいる為、冗長性が全くないことから、RAIDには含まれないとも言われます。構成する1台が破損しただけで全データを失う危険性が伴うので、通常のシングル構成のHDDよりも構成しているHDDの台数分に比例して故障率が上がることになり、リスクが高くおすすめできる構成ではありません。もし1台でも障害が発生した場合は、残りのHDDが全て正常だとしてもデータを取り出すことは非常に難しいため、弊社にご連絡ください。
ストライピンググループをミラーリングしたものがRAID 0+1になります。HDD[1]〜[2]で構成されたストライピンググループ1と、HDD[3]〜[4]で構成されたストライピンググループ2があったとします。この構成の場合、ストライピンググループ1のHDD[1]に障害が発生した場合は、グループ1のストライピングが使えなくなります。この状態ではストライピンググループ2だけが動いている状態になるわけですので、さらにHDD[3][4]のいずれかのHDD1本に障害が発生したら、RAID全体が使えなくなります。1台でも障害が発生した場合は、残りのHDDに障害が発生する前にバックアップが重要です。もし2台以上に障害が発生した場合は、データを取り出すことは非常に難しいため、データレスキューセンターなどのデータ復旧サービスへご相談ください。
ミラーリングしたグループをストライピングしたのがRAID 1+0になります。HDD[1]と[2]、HDD[3]と[4]というミラーリンググループがあったとします。それら全体を、ひとつのストライピンググループにする状態で、構成されることになります(見た目上はHDD[1]とHDD[3]のRAID0構成になります)。この構成の場合、HDD[1]に障害が発生して続けてHDD[2]に障害が発生すると、RAID全体が使えなくなります。ただし、HDD[3]かHDD[4]のどちらかに障害が発生した場合は、稼働可能です。1台でも障害が発生した場合は、残りのHDDに障害が発生する前にバックアップすることが重要です。2台以上に障害が発生した場合は、組み合わせによっては、完全にRAIDが機能しなくなり、データを取り出すことも非常に難しくなりますので、データレスキューセンターにご相談ください。
データアクセスの最中に突然に電源が切れたりした場合などで、RAID構成をつかさどる(OS等の)システム部が壊れたり、ファイルフォーマットの構造情報が破損する場合があります。こういったトラブルのリスクは一般のパソコンや外付けHDDでも事情は変わりませんが、データ復旧の難易度は大きく変わります。
一般のパソコンのようにHDDが1台のみのシングル状態で構成されている場合は、システムの自動修復や別のOSシステムからアクセスを試みるなどの方法で速やかにデータの復旧が出来るケースがありますが、RAID構成の場合は個々のHDDには細かくスライスされた(さらに構成によっては複雑な並び順になった)状態でデータが保存されていることもあるため、復旧の際には元のRAID構成をシミュレートしながらアクセスする必要があります。難易度が非常に高い作業になるため、書き換え等を行う場合は、復旧企業に相談・確認されることをお勧めいたします。また新たなRAID構成のシステムにそのまま元のHDDを繋げても、そのまま元の構成を読み直すわけではなく、逆に新たなRAID構成として再構築や初期化が行われることもありますので注意しましょう。
冗長性があるRAID構成の場合、構成する1台のハードディスクに破損が発生しても、その1台を除いた状態のままで動作する機能を持つものもあります。縮退運転・縮退運用などと呼ばれている機能で、システムのダウン、緊急停止を避けるという大きなメリットがあります。通常は縮退運転が始まった時点で、メッセージが表示されたり、何からのランプが点灯するなどで警告を伝え、ユーザーは余裕が出来た時点でシステムを一旦停止し、縮退運転を解消するように交換・修復等を行うというのが本来期待されている機能です。
縮退運転中でもユーザーが使用してる分には大きな影響がないため、縮退運転に気づかないまま使用を続けてしまい、別のハードディスクが故障して完全にダウンしてしまったのでデータを復旧してほしいという依頼もデータレスキューセンターにはよくあります。縮退した(冗長性が全くない)状態というのは、構成するHDD台数分に比例して故障リスクが高まった状態ですので、別の障害が発生するリスクも高まるのが第一に挙げられますし、さらに何らかの障害が続けて発生した後には、データ復旧がより難しくなるというデメリットもあります。
一昔前に比べて現在は非常に安価にRAIDを構築することが可能となっておりますが、導入をする際にはマニュアルや設定などをきちんと確認した上で、正しい運用を心がけましょう。
上記でも触れましたが、RAID構成でもデータの誤削除やウィルス感染、ファイルの破損等によるデータの損失は一般のパソコンや外付けHDDと同じリスクで常に存在しています。またそういった状態からのデータ復旧を試みる際にも、RAID構成の場合は難易度があがるというデメリットもあります。運用の際にはバックアップを含めて、システムを構築するように気をつけましょう。