Dell D400ノートパソコンでUbuntu 10.10を実行しています。 NexStar3 USBエンクロージャに取り付けられたWD Scorpio Blue 2.5インチドライブのLVMボリュームからシステムを起動して実行しました。
ほとんどの場合、これは非常にうまく機能します。ただし、約数日が経過すると、通常システムはシステムパーティションへのアクセスを失います。正確に何が起こっているのかわからないし、関連するシステムユーティリティにアクセスできないため、診断するのは難しいです。
$ mount
bash: /bin/mount: Input/output error
$ ls
Bus error
$ tail /var/log/messages
bash: /usr/bin/tail: Input/output error
$ cat /var/log/messages
Segmentation fault
閉じてもすっきりと完了しません。
$ sudo shutdown -h now
bash: /usr/bin/sudo: Input/output error
$ sudo halt
bash: /usr/bin/sudo: Input/output error
私が見つけた唯一の回復手順は、電源ボタンを数秒間押し続けてハードリブートすることです。
このエラー状態が有効な場合、エンクロージャ LED は点灯し続けます。通常は点滅し続けます。
内部ドライブからシステムファイルを移行しました。移行前にはこのような問題はありませんでした。しばらくしてから始まったことを覚えているようです。
修正する
リモートロギングのためのGillesの提案に従って、以下のsyslog
出力が生成されました。
<6>Aug 12 01:00:25 box kernel: [229825.120148] usb 1-5: reset high speed USB device using ehci_hcd and address 2
<3>Aug 12 01:00:26 box kernel: [229825.700267] usb 1-5: device not accepting address 2, error -71
<3>Aug 12 01:00:26 box kernel: [229825.758145] ehci_hcd 0000:00:1d.7: port 5 reset error -110
<3>Aug 12 01:00:26 box kernel: [229825.758160] hub 1-0:1.0: hub_port_status failed (err = -32)
<6>Aug 12 01:00:26 box kernel: [229825.960116] usb 1-5: USB disconnect, address 2
<6>Aug 12 01:00:26 box kernel: [229825.980062] sd 2:0:0:0: Device offlined - not ready after error recovery
<6>Aug 12 01:00:26 box kernel: [229825.980108] sd 2:0:0:0: [sdb] Unhandled error code
<6>Aug 12 01:00:26 box kernel: [229825.980112] sd 2:0:0:0: [sdb] Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
<6>Aug 12 01:00:26 box kernel: [229825.980118] sd 2:0:0:0: [sdb] CDB: Read(10): 28 00 31 b1 a0 35 00 00 20 00
<3>Aug 12 01:00:26 box kernel: [229825.980132] end_request: I/O error, dev sdb, sector 833724469
<3>Aug 12 01:00:26 box kernel: [229825.980167] Buffer I/O error on device dm-1, logical block 44564614
<4>Aug 12 01:00:26 box kernel: [229825.980171] lost page write due to I/O error on dm-1
<3>Aug 12 01:00:26 box kernel: [229825.984068] Aborting journal on device dm-4-8.
<3>Aug 12 01:00:26 box kernel: [229825.984100] Buffer I/O error on device dm-4, logical block 1081344
<4>Aug 12 01:00:26 box kernel: [229825.984104] lost page write due to I/O error on dm-4
<3>Aug 12 01:00:26 box kernel: [229825.984113] JBD2: I/O error detected when updating journal superblock for dm-4-8.
<3>Aug 12 01:00:26 box kernel: [229825.984181] Buffer I/O error on device dm-4, logical block 1675867
<4>Aug 12 01:00:26 box kernel: [229825.984185] lost page write due to I/O error on dm-4
<3>Aug 12 01:00:26 box kernel: [229825.984190] Buffer I/O error on device dm-4, logical block 1675868
<4>Aug 12 01:00:26 box kernel: [229825.984193] lost page write due to I/O error on dm-4
<3>Aug 12 01:00:26 box kernel: [229825.984200] Buffer I/O error on device dm-4, logical block 1684657
<4>Aug 12 01:00:26 box kernel: [229825.984204] lost page write due to I/O error on dm-4
<4>Aug 12 01:00:26 box kernel: [229825.984389] JBD2: Detected IO errors while flushing file data on dm-4-8
<43>Aug 12 01:00:26 box rsyslogd: /var/log/syslog
<43>Aug 12 01:00:26 box rsyslogd: /var/log/kern.log
<43>Aug 12 01:00:26 box rsyslogd: /var/log/messages
<2>Aug 12 01:00:26 box kernel: [229825.991754] EXT4-fs error (device dm-4): ext4_journal_start_sb: Detected aborted journal
<2>Aug 12 01:00:26 box kernel: [229825.991765] EXT4-fs (dm-4): Remounting filesystem read-only
<3>Aug 12 01:00:26 box kernel: [229826.136474] Buffer I/O error on device dm-1, logical block 44726233
<4>Aug 12 01:00:26 box kernel: [229826.136480] lost page write due to I/O error on dm-1
<3>Aug 12 01:00:26 box kernel: [229826.136487] Buffer I/O error on device dm-1, logical block 44726234
<4>Aug 12 01:00:26 box kernel: [229826.136491] lost page write due to I/O error on dm-1
<3>Aug 12 01:00:26 box kernel: [229826.144081] Aborting journal on device dm-1-8.
<3>Aug 12 01:00:26 box kernel: [229826.144099] Buffer I/O error on device dm-1, logical block 13139968
<4>Aug 12 01:00:26 box kernel: [229826.144103] lost page write due to I/O error on dm-1
<3>Aug 12 01:00:26 box kernel: [229826.144110] JBD2: I/O error detected when updating journal superblock for dm-1-8.
<0>Aug 12 01:00:26 box kernel: [229826.144124] journal commit I/O error
下から10行目の229825.991765は、ファイルシステムが読み取り専用モードで再マウントされる場所です。残りの部分を調べましたが、完全に削除されたという内容は何も見られませんでした。したがって、システム自体にアクセスできなくなった理由は少し謎です。
それにもかかわらず、最初にUSBエラーがクラッシュの原因であるようです。
ノートパソコンのUSBコントローラ/ドライバに問題がある可能性がありますか?それとも、USBエンクロージャを使用する可能性が高くなりますか?私はどのように知っていますか?
答え1
良くないようです。 dmesgを使用してカーネルに問題があるかどうかを確認しますが、このコマンドも失敗する可能性があります。多くのLinuxディストリビューションはコンソール10にカーネルメッセージを表示し、Ctrl-Alt-F10を使用してそのメッセージに移動できます。
答え2
睡眠問題ですか?カーネルラインapm=off
でチップセットが目を覚ましていることを確認できます。acpi=off
また、BIOS設定を確認し、デバイスをスリープモードに切り替えようとしないことを確認してください。
hdparm
また、しばらくするとドライブがスリープ状態になることを確認できます。詳細をすぐに覚えてはいけません。pinfo hdparm
それ以外の場合はman hdparm
役に立ちます。
答え3
入出力エラーは、一部のデータが失われることを意味します。これは、パイプラインに関する情報がほとんど信頼できないことを意味します。
診断部分をスキップしてデータ回復シナリオを考えてみましょう。