20個のハードドライブraid6アレイがubuntuインストールで動作を停止した理由を診断しようとしています。強制的に起動しようとすると、複数のドライブがRAIDにまったく表示されなくなり、自分のコンピュータにもドライブとして表示されなくなりました。
ハードウェアの問題だと思ってケースを開き、SATAケーブルに触れました。私は攻撃を中断し、いくつかのワイヤを抜いて再接続し、コンピュータに新しいSATAデバイスをチェックするように強制したいと思いました。このサイトを検索した結果、SATAデバイスをフラッシュするには、次のコマンドを実行するように求められました。
for host in /sys/class/scsi_host/*; do echo "- - -" | sudo tee $host/scan; ls /dev/sd* ; done
コマンド出力には、ドライブが消えたと表示されます。 (説明すると、ドライブsdb-sduはraid6アレイの一部であり、このコマンドを使用するとsdo、sdp、sdq、sdrの4つが消えます。)
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sdo /dev/sdq /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdp /dev/sdr /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sdo /dev/sdq /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdp /dev/sdr /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sdp /dev/sdr /dev/sdt
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdq /dev/sds /dev/sdu
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdt
- - -
/dev/sda /dev/sda2 /dev/sdc /dev/sde /dev/sdg /dev/sdi /dev/sdk /dev/sdm /dev/sds /dev/sdu
/dev/sda1 /dev/sdb /dev/sdd /dev/sdf /dev/sdh /dev/sdj /dev/sdl /dev/sdn /dev/sdt
より多くのドライブが消えていることを確認するために、SATAケーブルを抜いて、消えるドライブの接続を物理的に確認しました。これらのトラブルシューティングの過程で、消えた4つのドライブはすべて、私が最低4年間問題なく使用していた8ポートPCIE to SATAカードに接続されていることを発見しました。
システムを数回再起動し、起動時にいくつかのハードドライブが欠落していますが、Ubuntuディスクユーティリティを開いた後にビープ音で再び表示されることがわかりました。その後、上記のコマンドを実行すると、4つのドライブが再び消えました。
raid6アレイは、現在接続されているドライブの数と最後の変更時刻について異なる値を報告するいくつかのドライブのために混乱しています。強制的に2回組み立てようとしましたが、機能し再構築が始まりましたが、2台以上のドライブがOSから完全に消えて再構築が中断されました。
カードですか?交換する必要がありますか?
編集:問題のカードは次のとおりです。https://www.ebay.com/itm/Marvell-Chipset-8-Ports-SATA-3-0-6GB-PCI-Express-Card-NCQ-Port-Multiplier-FIS/191962272465?hash=item2cb1d7d2d1:g: -UMAAoxy4t1SmhAS
RAIDアレイを停止した後、次のコマンドを実行してSATAデバイスを確認すると、dmesgの内容は次のとおりです。
[ 65.849212] md: md0 stopped.
[ 76.462011] ata1: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[ 76.463189] ata1.00: configured for UDMA/133
[ 76.791618] ahci 0000:06:00.0: FBS is disabled
[ 76.951538] ahci 0000:06:00.0: FBS is enabled
[ 76.952111] ata10.00: SATA link up 3.0 Gbps (SStatus 123 SControl 330)
[ 77.267083] ata10.01: SATA link down (SStatus 610 SControl 330)
[ 77.581891] ata10.02: SATA link down (SStatus 610 SControl 330)
[ 77.894936] ata10.03: SATA link down (SStatus 610 SControl 330)
[ 78.211968] ata10.04: SATA link down (SStatus 610 SControl 330)
[ 78.215129] ata10.00: configured for UDMA/133
[ 82.816960] ata10.01: SATA link down (SStatus 610 SControl 330)
[ 83.128896] ata10.02: SATA link down (SStatus 610 SControl 330)
[ 83.440843] ata10.03: SATA link down (SStatus 610 SControl 330)
[ 83.752802] ata10.04: SATA link down (SStatus 610 SControl 330)
[ 88.192093] ata10.01: SATA link down (SStatus 610 SControl 330)
[ 88.504051] ata10.02: SATA link down (SStatus 610 SControl 330)
[ 88.815986] ata10.03: SATA link down (SStatus 610 SControl 330)
[ 89.127946] ata10.04: SATA link down (SStatus 610 SControl 330)
[ 89.127970] ata10.01: disabled
[ 89.127988] ata10.02: disabled
[ 89.128003] ata10.03: disabled
[ 89.128018] ata10.04: disabled
[ 89.128332] ata10.01: detaching (SCSI 10:1:0:0)
[ 89.129036] sd 10:1:0:0: [sdo] Synchronizing SCSI cache
[ 89.129059] sd 10:1:0:0: [sdo] Synchronize Cache(10) failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[ 89.129060] sd 10:1:0:0: [sdo] Stopping disk
[ 89.129066] sd 10:1:0:0: [sdo] Start/Stop Unit failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[ 89.185725] ata10.02: detaching (SCSI 10:2:0:0)
[ 89.186427] sd 10:2:0:0: [sdp] Synchronizing SCSI cache
[ 89.186454] sd 10:2:0:0: [sdp] Synchronize Cache(10) failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[ 89.186455] sd 10:2:0:0: [sdp] Stopping disk
[ 89.186461] sd 10:2:0:0: [sdp] Start/Stop Unit failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[ 89.253718] ata10.03: detaching (SCSI 10:3:0:0)
[ 89.254504] sd 10:3:0:0: [sdq] Synchronizing SCSI cache
[ 89.254528] sd 10:3:0:0: [sdq] Synchronize Cache(10) failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[ 89.254529] sd 10:3:0:0: [sdq] Stopping disk
[ 89.254535] sd 10:3:0:0: [sdq] Start/Stop Unit failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[ 89.317679] ata10.04: detaching (SCSI 10:4:0:0)
[ 89.318503] sd 10:4:0:0: [sdr] Synchronizing SCSI cache
[ 89.318527] sd 10:4:0:0: [sdr] Synchronize Cache(10) failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[ 89.318528] sd 10:4:0:0: [sdr] Stopping disk
[ 89.318534] sd 10:4:0:0: [sdr] Start/Stop Unit failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[ 89.460199] ata11: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[ 89.462818] ata11.00: configured for UDMA/133
[ 89.796131] ata12: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[ 89.798858] ata12.00: configured for UDMA/133
[ 90.132065] ata13: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[ 90.133201] ata13.00: NCQ Send/Recv Log not supported
[ 90.134221] ata13.00: NCQ Send/Recv Log not supported
[ 90.134227] ata13.00: configured for UDMA/133
[ 90.472068] ata14: SATA link down (SStatus 0 SControl 300)
[ 90.808247] ata15: SATA link down (SStatus 0 SControl 300)
[ 91.147895] ata16: SATA link down (SStatus 0 SControl 300)
[ 91.484079] ata17: SATA link down (SStatus 0 SControl 300)
[ 91.824122] ata18: SATA link up 1.5 Gbps (SStatus 113 SControl 300)
[ 91.824750] ata18.00: configured for UDMA/66
[ 92.155995] ata2: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[ 92.157411] ata2.00: configured for UDMA/133
[ 92.491879] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 92.494534] ata3.00: configured for UDMA/133
[ 92.827218] ata4: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 92.828045] ata4.00: supports DRM functions and may not be fully accessible
[ 92.830499] ata4.00: supports DRM functions and may not be fully accessible
[ 92.832149] ata4.00: configured for UDMA/133
[ 93.847192] ata5: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 93.849644] ata5.00: configured for UDMA/133
[ 94.175633] ata6: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 94.177221] ata6.00: configured for UDMA/133
[ 94.664704] ata7: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 94.667911] ata7.00: configured for UDMA/133
[ 95.152651] ata8: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[ 96.732470] ata8.00: configured for UDMA/133
[ 97.236448] ata9: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[ 97.237568] ata9.00: configured for UDMA/133