データ復旧:トップ > メディア解説 > ハードディスク(HDD)の障害
磁気ヘッドとは、ディスクの読み書きを行う為のパーツで、レコードの針のような役割を持っています。
ヘッド自体の不良、機能低下や剥離、ヘッドを支える機構部分の障害などにより、正常にディスクが読み取れなくなることがあります。障害の原因としては、振動や衝撃などのほかにも、経年劣化などあり様々です。
ヘッドとディスク表面の隙間は、わずか10nm(ナノメートル)という非常に小さなものです。これはタバコの煙の粒子が200ナノ〜500ナノメートルぐらいですから、桁違いの精密さを誇っています。その為、磁気ヘッドなどの内部パーツを交換する場合は、塵や埃を除いたクリーンな環境下で作業を行う必要があり、安易にハードディスクを開封をしてしまうと、致命的なダメージを与えてデータ復旧ができなくなることがありますので注意が必要です。
なお、動作中にヘッドがディスクに接触(クラッシュ)することもあります。衝撃などの直接的な原因だけでなく、突然発生することもあります。障害が軽微であればしばらく正常動作することもありますが、ほとんどの場合、徐々に悪化していきますので、例えばハードディスクを落下させた後で正常に動作しているように見えても危険です。
ヘッド障害の代表的な現象としては、「カタカタ」「カコン」「カッツン」というような異音が発生することがあり、これはヘッドが正常動作せずにストッパーに接触している音です。他にもディスクを擦っている際に「シュー」というような音が発生することもあります。この場合はヘッドがディスク表面の磁性体を削っている可能性がありますので、速やかに電源を落としてください。
通常はディスクの回転直後から異音を発生しますが、異音が断続的に発生しながらも、一時的に正常なアクセスをすることも稀にあります。また、同じ異音でも内部からビープ音が発生する場合がありますが、これは多くの場合スピンドルモーターの異常が原因になります。
ほとんどのハードディスクは、駆動していない時には強制的にヘッドが退避領域に退避する仕様になっており、最近は動作中に強い衝撃などを感知した時には自動で退避する機構が備わっているモデルもあります。ただし、電源遮断時の異常や振動等により、ヘッドが退避領域に戻りきれなかった場合は、ヘッドが記録面に貼り付いて吸着してしまうことがあります。また、経年劣化や長い間電源を入れていない古いハードディスクでも、ヘッドの吸着が発生する場合があります。症状としては、ハードディスクからモーターの駆動音が聞こえなくなりますが、 「ウッウッ」「ジッジッ」と回ろうとして回れないような小さな異音が聞こえる場合もあります。
基盤はハートディスクを直接制御するハードウェアで、各種のコントローラーチップが搭載されていますが、これらのチップが一つでも欠けた場合には重大な障害が発生します。
基盤障害の原因としては、電源ユニットの故障等により想定以上の電流が流れてしまったり、経年劣化によるチップの破損等があげられます。現象としては、モーターが回らず一切反応がなくなったり、BIOSでも認識されなくなります。
このような場合、安易に同型品のハードディスクと基盤を交換することは厳禁です。基盤のファームウェアの種類・バージョンは型番ごとに異なるだけでなく、製造ロット単位でも違うことが多いためです。最近のファームウェアは、基盤とハードディスクアセンブリのそれぞれのパラメーターもチェックしていますので、同じ型番のハードディスクでも、基盤交換を行うと障害が発生することがあります。具体的には、基盤をロックさせたり、ヘッドが暴走してディスク自体を破損してしまうなど、データ復旧が不可能な状況に陥ることがありますので注意が必要です。
●FUJITSU社の「MPG」シリーズ全般
2001年3月31日以前に販売されていたハードディスクに搭載されていたLSIチップに不具合があり、高温多湿下での使用を続けると、LSIをショートさせることが発覚しています。
※それ以降の発売品でも該当チップ品が使われている場合があるとの指摘もあります。
原因はLSIチップ封止材として赤リンが使用されていたためで、高温多湿化においては化学反応によりマイグレーションを起こし、その結果ピン間が短絡するというものです。
使用直後は問題ありませんが、半年以上使用を続けていると高い確率でチップがショートしてしまい、ハードディスクが異音を発生するようになるなどで、BIOSでも正常認識されなくなります。
●Maxtor社「6Y・7Y」の初期シリーズ
モーターコントローラのチップであるSMOOTHが古いバージョンのものだと非常に発熱しやすく、使用中に焦げてしまう場合があります。チップが焼け焦げた場合、ハードディスクのモーターが回転しないなど反応が一切なくなります。
ファームウェアとはハードディスクを直接制御するソフトウェアのことです。ファームウェアは、数百KB程度と非常に小さな容量ですが、ディスクヘッド移動を制御したり、ホストコントローラーとの通信やキャッシュ管理など、ハードディスクのすべての動きを制御する非常に重要な役割を持っています。
ファームウェアの読み取りに失敗したりその一部が破損した場合は、ハードディスク自体が正常に動作しなくなります。具体的には通電後、シークまでは正常でもBIOSで認識されなくなったり、誤った型番や容量で認識されてしまう等、正常な読み取りが一切できなくなります。
●Seagate社「Barracuda 7200.11」「DiamondMax 22」「Barracuda ES.2 SATA」「SV35」シリーズ
2008年12月以前に発売されていた上記モデルの一部に、致命的なファームウェアのバグが発覚しています。Seagate社発表の症状としては、「電源のオフ/オン操作の後にデータにアクセス出来なくなる」という現象で、具体的には通電すると通常通りスピンアップし正常にレディしているような挙動を示しているにも関わらず、ハードディスクが正常にあるいは全く認識されなくなります。原因は「HDDのファームウェア内に用意されているジャーナル/ログ領域にちょうど320個のエントリがある状態」で電源をOFFにすると、次にONになったときにエラーが発生し初期化やブートに失敗しているという告発がされています。
●WesternDigital社「WDxxEADS」「WDxxEARS」のCaviarGreenシリーズ
2008年10月以降に販売されている上記モデルの一部に、リード・ライト時の転送速度が著しく低下する症状が確認されています。この状態になると「正常に認識しない」「フォルダやファイルにアクセスしても開くのが極端に遅い」「HDD診断を行うと転送速度が数MB/sまで落ち込む」などがあり、一般的には「低速病」とも呼ばれています。
PCやHDDには振動や読み取りエラーなどの異常を感知した場合、HDDの動作速度を一時的に制限する機能が付いていますが、低速病が発症したHDDは、これが永続的に固定化された状態に陥っていると見られています。こちらの障害に関しては、通常のリードエラー障害等と区別することが難しく、発生のタイミングや原因の特定も困難なため、WesternDigital社からも公式発表はされておりません。
なおWesternDigital社のHDDには、IntelliPark という省電力と保全のためにヘッドを自動退避する機能が付いており、一部の型番のHDDではこれが頻発しやすい設定になっているようです。それが原因となって、いわゆる「プチフリーズ」現象が起きやすいと指摘もされており、こちらの症状も「低速病」と呼称されていることが多いようです。
ハードディスクのデータの最小記録単位をセクタといい(通常1セクタ=512バイト)、データの読み書きが正常に出来ないセクタのことを不良セクタと呼びます。
通常はこの不良セクタが検出されると予備のセクタに自動的に置き換えが行われていますが、その代替が行われることなく読み取り不能となるとリードエラーとなり、ハードディスク上のデータの読み書き時にエラーが発生してしまいます。また、代替が許容する限度を超えてしまうと、アクセスに対し全く反応が無くなる場合もあります。
読み書きが出来なくなる原因については多数存在し、ヘッドや磁性の劣化などから、アライメントやヘッドの位置ズレ、発熱等の金属膨張による記録位置のズレなどでも、特定部分が読めないという状況になります。
現象としては、症状が軽い段階では、フォルダやファイルが進行的に表示されなくなる(アクセス出来なくなる)、またデータの読み書き時に「巡回冗長検査エラー(CRCエラー) 」や「遅延書き込みエラー」といったエラーメッセージが出る場合もあります。
リードエラー障害からデータを復旧する方法の多くは、読み出し出来ないセクタを一旦スキップして調査を進めます。その後、スキップしたセクタの情報が必要な場合にはリードリトライや逆順での読み出しを試みます。逆順での読み出しを行うことでHDD内部の挙動が変わり、リードエラーが改善されるケースも多く確認されています。
しかし、全てのリードエラーを完全に解消するのは難しく、リードエラーが多発している場合は、リードリトライや逆順での読み出しを繰り返し行わなければならない為、調査作業が非常に難航します。そのようなケースの場合、弊社ではお客様のデータを少しでも多く復旧する為に、読み取れる間は可能な限りデータの読み出しを継続することを基本としています。
ハードディスクには「Self-Monitoring, Analysis and Reporting Technology」、略してS.M.A.R.T.(スマート)と呼ばれる自己診断機能が備わっています。
各種検査項目の数値をハードディスク自身が常時モニタリングして記録していて、対応したツールでその数値を解析し、経年劣化による故障を予測することができます。
Windows環境であれば下記のフリーソフトでS.M.A.R.T.の値を確認することが可能です。
CrystalDiskInfo
※Windows2000〜Windows8.1対応、一部Windows Server OS(Server Core)では動作しません
記録している数値は、ハードディスクの稼働時間、電源ON/OFFの回数、ディスクの回転数、各種エラーの発生件数、不良セクタの数など多岐にわたります。
通常、この数値はパソコンの使用者が見ることはありませんが、S.M.A.R.T.に対応したソフトで確認が可能です。S.M.A.R.T.はあくまで各種検査項目を記録するだけの仕組みなので、ソフト上で将来の故障予測を行うことになります。そのため、ソフトによって予測結果が変わってくる場合があります。
また、S.M.A.R.T.はそれまでの稼働状況から、将来の故障を予測する仕組みですので、安定した動作環境では有効活用できますが、当然のことながら落下や停電などのトラブルや誤削除を予測できるものではなく過信は禁物です。