システム(16GB RAM、6コア、RAID0 PCIe SSD)で過度のディスクIOを実行すると、システムがハングし、最終的にクラッシュします。一般的な日常的なディスクIOは問題ではなく、長い読み取り/書き込み(データベースの再索引付けなど)だけが問題を引き起こす可能性があります。
いくつかの調査では、次のdmesg出力を示しています。
[...] ata2: exception Emask 0x10 SAct 0x0 SErr 0x90202 action 0xe frozen
[...] ata1: SError: { RecovComm Persist PHYRdyChg 10B8B }
[...] ata1: hard resetting link
[...] ata4: irq_stat 0x00400000, PHY RDY changed
システムに接続されたさまざまなSATAデバイスの多数のその他のログ。過度のディスクIOを実行するときに他の入力があると、システム(マウスの移動など)が5〜30秒間停止します。
エラーが複数のデバイスに表示され、他のデバイスから入力を提供しているとき/ディスクではなく割り込みが発生したときにシステムが概略的に見える場合...マザーボードを想定します。気温は大丈夫です。 memcheckに合格しました。衝突はカーネルパニックやシャットダウンではなく、完全なソフトロックです。
これは合理的に見えますか?私が確認できる他のものはありますか?
編集:Fedora20、870A-UD3マザーボードのホームサーバー、Intel 910 PCIe SSD + OCZ vertex + Intel X25
Edit2:ワークステーションはホームオフィスにあり、Postgresqlからデータを離脱するなどの操作を実行します。それはすべて非常に退屈で、もう一つの近い投票をする価値はありません。
答え1
これは、システム基板、ケーブル接続、または電源装置の問題である可能性があります。 SATAドライブ、OCZ、およびIntel X25がマザーボードに接続されている場合、これが原因である可能性があります。 Intel 910が影響を受けるという兆候はありません。
答え2
SATAケーブルが破損しています。私はこのエラーを何度も見ました。https://bbs.archlinux.org/viewtopic.php?id=129401