時々、コンピュータの起動(Debian の実行)で奇妙な問題が発生します。それで、「dmesg」コマンドを発行しました。出力に多くのエラーがあります。ただし、ハードドライブで拡張SMARTテストを実行すると(「smartctl -t long /dev/sda」コマンドを使用)、結果としてディスクが破損していないことがわかりました。
これらのエラーの原因は何ですか?
エラーは次のとおりです。
(...)
[ 505.918537] ata3.00: exception Emask 0x50 SAct 0x400 SErr 0x280900 action 0x6 frozen
[ 505.918549] ata3.00: irq_stat 0x08000000, interface fatal error
[ 505.918558] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 505.918566] ata3.00: failed command: READ FPDMA QUEUED
[ 505.918579] ata3.00: cmd 60/40:50:20:5b:60/00:00:0b:00:00/40 tag 10 ncq 32768 in
res 40/00:54:20:5b:60/00:00:0b:00:00/40 Emask 0x50 (ATA bus error)
[ 505.918586] ata3.00: status: { DRDY }
[ 505.918595] ata3: hard resetting link
[ 506.410055] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 506.422648] ata3.00: configured for UDMA/133
[ 506.422679] ata3: EH complete
[ 1633.123880] md: bind<sdb3>
[ 1633.187966] RAID1 conf printout:
[ 1633.187977] --- wd:1 rd:2
[ 1633.187984] disk 0, wo:0, o:1, dev:sda3
[ 1633.187989] disk 1, wo:1, o:1, dev:sdb3
[ 1633.188866] md: recovery of RAID array md0
[ 1633.188871] md: minimum _guaranteed_ speed: 1000 KB/sec/disk.
[ 1633.188875] md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for recovery.
[ 1633.188890] md: using 128k window, over a total of 1943618560k.
[ 1634.167341] ata3.00: exception Emask 0x50 SAct 0x7f80 SErr 0x280900 action 0x6 frozen
[ 1634.167353] ata3.00: irq_stat 0x08000000, interface fatal error
[ 1634.167361] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 1634.167369] ata3.00: failed command: READ FPDMA QUEUED
[ 1634.167382] ata3.00: cmd 60/00:38:00:00:6f/02:00:01:00:00/40 tag 7 ncq 262144 in
res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
[ 1634.167389] ata3.00: status: { DRDY }
[ 1634.167395] ata3.00: failed command: READ FPDMA QUEUED
[ 1634.167407] ata3.00: cmd 60/00:40:00:02:6f/02:00:01:00:00/40 tag 8 ncq 262144 in
res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
[ 1634.167413] ata3.00: status: { DRDY }
[ 1634.167418] ata3.00: failed command: READ FPDMA QUEUED
[ 1634.167429] ata3.00: cmd 60/00:48:00:04:6f/02:00:01:00:00/40 tag 9 ncq 262144 in
res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
[ 1634.167435] ata3.00: status: { DRDY }
[ 1634.167439] ata3.00: failed command: READ FPDMA QUEUED
[ 1634.167451] ata3.00: cmd 60/00:50:00:06:6f/02:00:01:00:00/40 tag 10 ncq 262144 in
res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
[ 1634.167457] ata3.00: status: { DRDY }
[ 1634.167462] ata3.00: failed command: READ FPDMA QUEUED
[ 1634.167473] ata3.00: cmd 60/00:58:00:08:6f/02:00:01:00:00/40 tag 11 ncq 262144 in
res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
[ 1634.167479] ata3.00: status: { DRDY }
[ 1634.167484] ata3.00: failed command: READ FPDMA QUEUED
[ 1634.167495] ata3.00: cmd 60/00:60:00:0a:6f/02:00:01:00:00/40 tag 12 ncq 262144 in
res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
[ 1634.167500] ata3.00: status: { DRDY }
[ 1634.167505] ata3.00: failed command: READ FPDMA QUEUED
[ 1634.167516] ata3.00: cmd 60/80:68:00:0c:6f/00:00:01:00:00/40 tag 13 ncq 65536 in
res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
[ 1634.167522] ata3.00: status: { DRDY }
[ 1634.167527] ata3.00: failed command: READ FPDMA QUEUED
[ 1634.167538] ata3.00: cmd 60/00:70:80:0c:6f/02:00:01:00:00/40 tag 14 ncq 262144 in
res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
[ 1634.167544] ata3.00: status: { DRDY }
[ 1634.167553] ata3: hard resetting link
[ 1634.658816] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 1634.672645] ata3.00: configured for UDMA/133
[ 1634.672696] ata3: EH complete
[ 1637.687898] ata3.00: exception Emask 0x50 SAct 0x3ff000 SErr 0x280900 action 0x6 frozen
[ 1637.687910] ata3.00: irq_stat 0x08000000, interface fatal error
[ 1637.687918] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 1637.687926] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.687940] ata3.00: cmd 60/00:60:80:a7:af/02:00:02:00:00/40 tag 12 ncq 262144 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.687947] ata3.00: status: { DRDY }
[ 1637.687953] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.687965] ata3.00: cmd 60/00:68:80:a9:af/02:00:02:00:00/40 tag 13 ncq 262144 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.687971] ata3.00: status: { DRDY }
[ 1637.687976] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.687987] ata3.00: cmd 60/80:70:80:ab:af/01:00:02:00:00/40 tag 14 ncq 196608 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.687993] ata3.00: status: { DRDY }
[ 1637.687998] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.688009] ata3.00: cmd 60/00:78:00:ad:af/02:00:02:00:00/40 tag 15 ncq 262144 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.688015] ata3.00: status: { DRDY }
[ 1637.688020] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.688031] ata3.00: cmd 60/80:80:00:af:af/00:00:02:00:00/40 tag 16 ncq 65536 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.688037] ata3.00: status: { DRDY }
[ 1637.688042] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.688053] ata3.00: cmd 60/00:88:80:af:af/01:00:02:00:00/40 tag 17 ncq 131072 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.688059] ata3.00: status: { DRDY }
[ 1637.688064] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.688075] ata3.00: cmd 60/80:90:80:b0:af/00:00:02:00:00/40 tag 18 ncq 65536 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.688081] ata3.00: status: { DRDY }
[ 1637.688085] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.688096] ata3.00: cmd 60/00:98:00:b1:af/02:00:02:00:00/40 tag 19 ncq 262144 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.688102] ata3.00: status: { DRDY }
[ 1637.688107] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.688118] ata3.00: cmd 60/00:a0:00:b3:af/01:00:02:00:00/40 tag 20 ncq 131072 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.688124] ata3.00: status: { DRDY }
[ 1637.688129] ata3.00: failed command: READ FPDMA QUEUED
[ 1637.688140] ata3.00: cmd 60/00:a8:00:b4:af/01:00:02:00:00/40 tag 21 ncq 131072 in
res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
[ 1637.688146] ata3.00: status: { DRDY }
[ 1637.688154] ata3: hard resetting link
[ 1638.179398] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 1638.192977] ata3.00: configured for UDMA/133
[ 1638.193029] ata3: EH complete
[ 1640.259492] md: export_rdev(sdb1)
[ 1640.326109] md: bind<sdb1>
[ 1640.346712] RAID1 conf printout:
[ 1640.346724] --- wd:1 rd:2
[ 1640.346731] disk 0, wo:0, o:1, dev:sda1
[ 1640.346736] disk 1, wo:1, o:1, dev:sdb1
[ 1640.346893] md: delaying recovery of md1 until md0 has finished (they share one or more physical units)
[ 1657.987964] ata3.00: exception Emask 0x50 SAct 0x40000 SErr 0x280900 action 0x6 frozen
[ 1657.987975] ata3.00: irq_stat 0x08000000, interface fatal error
[ 1657.987984] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 1657.987992] ata3.00: failed command: READ FPDMA QUEUED
[ 1657.988006] ata3.00: cmd 60/00:90:00:30:2e/03:00:09:00:00/40 tag 18 ncq 393216 in
res 40/00:94:00:30:2e/00:00:09:00:00/40 Emask 0x50 (ATA bus error)
[ 1657.988013] ata3.00: status: { DRDY }
[ 1657.988022] ata3: hard resetting link
[ 1658.479548] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 1658.493107] ata3.00: configured for UDMA/133
[ 1658.493147] ata3: EH complete
[ 1670.547791] ata3: limiting SATA link speed to 1.5 Gbps
[ 1670.547805] ata3.00: exception Emask 0x50 SAct 0x7f SErr 0x280900 action 0x6 frozen
[ 1670.547812] ata3.00: irq_stat 0x08000000, interface fatal error
[ 1670.547820] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 1670.547826] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547839] ata3.00: cmd 60/80:00:00:1f:2e/01:00:0c:00:00/40 tag 0 ncq 196608 in
res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547846] ata3.00: status: { DRDY }
[ 1670.547852] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547863] ata3.00: cmd 60/80:08:80:20:2e/00:00:0c:00:00/40 tag 1 ncq 65536 in
res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547869] ata3.00: status: { DRDY }
[ 1670.547875] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547886] ata3.00: cmd 60/00:10:00:21:2e/02:00:0c:00:00/40 tag 2 ncq 262144 in
res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547892] ata3.00: status: { DRDY }
[ 1670.547896] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547907] ata3.00: cmd 60/00:18:00:23:2e/02:00:0c:00:00/40 tag 3 ncq 262144 in
res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547913] ata3.00: status: { DRDY }
[ 1670.547918] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547929] ata3.00: cmd 60/00:20:00:25:2e/01:00:0c:00:00/40 tag 4 ncq 131072 in
res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547935] ata3.00: status: { DRDY }
[ 1670.547940] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547951] ata3.00: cmd 60/00:28:00:26:2e/02:00:0c:00:00/40 tag 5 ncq 262144 in
res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547957] ata3.00: status: { DRDY }
[ 1670.547961] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547972] ata3.00: cmd 60/00:30:00:28:2e/02:00:0c:00:00/40 tag 6 ncq 262144 in
res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547978] ata3.00: status: { DRDY }
[ 1670.547987] ata3: hard resetting link
[ 1671.039264] ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
[ 1671.053386] ata3.00: configured for UDMA/133
[ 1671.053444] ata3: EH complete
[ 2422.512002] md: md0: recovery done.
[ 2422.547344] md: recovery of RAID array md1
[ 2422.547355] md: minimum _guaranteed_ speed: 1000 KB/sec/disk.
[ 2422.547360] md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for recovery.
[ 2422.547378] md: using 128k window, over a total of 4877312k.
[ 2422.668465] RAID1 conf printout:
[ 2422.668474] --- wd:2 rd:2
[ 2422.668480] disk 0, wo:0, o:1, dev:sda3
[ 2422.668486] disk 1, wo:0, o:1, dev:sdb3
[ 2469.990451] md: md1: recovery done.
[ 2470.049986] RAID1 conf printout:
[ 2470.049997] --- wd:2 rd:2
[ 2470.050003] disk 0, wo:0, o:1, dev:sda1
[ 2470.050009] disk 1, wo:0, o:1, dev:sdb1
[ 3304.445149] PM: Hibernation mode set to 'platform'
[ 3304.782375] PM: Syncing filesystems ... done.
[ 3307.028591] Freezing user space processes ... (elapsed 0.001 seconds) done.
(...)
答え1
まず覚えてくださいSMARTドライブが健康であっても必ずしもドライブが損傷するわけではありません。はい健康。SMARTレポートは補助、絶対的な真実ではありません。
理由よりも何に興味がある場合は、最後の数段落まで下にスクロールしてみてください。しかし、中間テキストでは、私が提案するのが正しい行動方針だと思う理由を教えてくれます。あなたが投稿した内容から進む方法は、以下から派生しました。
それでは、これらのエラーの1つが私たちに何を伝えているのかを見てみましょう。
[ 1670.547805] ata3.00: exception Emask 0x50 SAct 0x7f SErr 0x280900 action 0x6 frozen
[ 1670.547812] ata3.00: irq_stat 0x08000000, interface fatal error
[ 1670.547820] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 1670.547826] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547839] ata3.00: cmd 60/80:00:00:1f:2e/01:00:0c:00:00/40 tag 0 ncq 196608 in
res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547846] ata3.00: status: { DRDY }
[ 1670.547852] ata3.00: failed command: READ FPDMA QUEUED
(一緒に行くべき部分があったらいいのですが、これらのバンドルが用意されているので、とにかく大丈夫でしょう。)
これLinux ata Wikiには、これらのエラーの読み方を説明するページがあります。。特別な、
- 値は「デバイスが準備されています。すべてが正常な場合は通常1」を
status
意味します。DRDY
状態値を見ることはDRDY
完全に正常で予想されるものです。 SError
この特定のコードスニペットに表示されるいくつかのコンポーネント値があります。UnrecovData
「データ整合性エラーが発生したため、インターフェイスは回復されませんでした。」HostInt
「ホストバスアダプタ内部エラー」10B8B
「10b~8bのデコードエラーが発生しました」BadCRC
「リンク層CRCエラーが発生しました」
10b8bエンコーディングは、ドライブ自体ではなく物理配線の信号同期とエラー検出を支援するために、8ビットを10ビットにエンコードします。ドライブは他の形式のFECまたはECCエンコーディングを使用している可能性が高く、そのエラーは通常一種のI / Oエラーの形式で表示されます。このエラーerror
の値はUNC
(「修正できないエラー - 一般的にディスクの不良セクタによって引き起こされます」)、行の最後に括弧内に「メディアエラー」(「ソフトウェアがメディアエラーを検出しました」)がある可能性がありますres
。はあなたが見るものとは異なるので、完全に排除することはできませんが、可能性は低く見えます。
「リンク層」は、ドライブ自体のコントローラとディスクドライブインタフェースチップ(ドライブの一部であり得る)との間の物理ケーブルおよび回路基板のトレースです。ナンチャオコンピュータはマザーボードにありますが、オフボードHBAにある可能性があります)。
HBAとも呼ばれるホストバスアダプタは、ストレージデバイスに接続される回路です。一般に、「ディスクコントローラ」と呼ばれるこの用語は、最新のシステムではやや間違った名前です。 HBAの最も顕著な部分は通常接続ポートであり、最も一般的にはSATAまたは一部のSASフォームファクタです。
UnrecovData
フラグはHostInt
基本的に「重大なエラーが発生し、回復不能または試行が行われていません」と通知します。その逆は、RecovData
「データ整合性エラーが発生しましたがインターフェイスが回復しました」を意味する可能性があります。 (ところで、「ホスト」はシステム全体ではなくHBAを表すので、おそらく代わりにHBAInt
使用します。)HostInt
10B8B
とすべての項目の組み合わせがBadCRC
物理リンク層を指しているため、ケーブル接続の問題が疑われます。
この疑いは、SMARTセルフテスト(ステータスレポートを除いてドライブ内で完全に行われます)で、製造元が結果レポートを保証するのに十分深刻であると見なすエラーが見つからなかったという事実にも裏付けられています。特に、長期SMARTセルフテストでは、ドライブにデータを保存または読み取るのに問題があるかどうかを報告する必要があります。
簡単に言うと:
だから私が最初にすることは簡単です。SATAケーブルの両端を抜き、再度挿入します。少し緩んで電気的接触を断続的に切断することがあります。問題が解決することを確認してください。影響を受けたディスクだけでなく、コンピュータ上のすべてのSATAケーブル接続に対してこれを行う価値があるかもしれません。オフボードHBAを使用している場合は、カードを取り外して再インストールします。なぜなら、すでにケーブル接続がめちゃくちゃであれば、試してみやすいからです。
失敗した場合、SATAケーブルを捨てて高品質のケーブルと交換してみてください。高品質のケーブルは少し高価ですが、このような問題を回避するのに役立つ場合は、一般的に価値があることがわかりました。リポジトリのエラーを見るのが好きな人はいません!
答え2
私の場合、2つの異なるディスクコントローラに2つのディスクが接続されていることがわかりました。 1つ目はPCI-Expressで、2つ目は一般的なPCIでした。両方の RAID ディスクを同じコントローラに接続したときに BadCRC エラーが削除されました。