ロジックダイレクトアクセスエラーリセット||

Question

これはLVMとは関係ありません。これは、ハードウェアRAIDコントローラによって作成された論理ディスクに関連しています。残念なことに、HPはLVM用語に似ている名前を選択しました。

2番目のログメッセージ（「デバイスが準備済み」）は、エラー状態が自動的に消去されたことを示します。

ハードウェアRAIDコントローラは、HP（E）SmartアレイP420iです。ファームウェアのバージョンは6.68であるように見えます。その後、ファームウェアのバージョンで修正されたいくつかの既知の問題があります。

https://support.hpe.com/connect/s/softwaredetails?言語=en_US&softwareId=MTX_42b6aa58956a438aa85bd73d0f&tab=revisionHistory

2017年11月の最新ファームウェアバージョンは8.32です。ここでダウンロード可能。最新バージョンの主な修正は次のとおりです。

RAIDスタックスレッドは、デフォルトのコードファームウェアから返された完了のためにキューをポーリングするため、コードをロックせずにライブロック状態でシステムが応答を停止することがあります。

これがあなたが見ている問題のようです。したがって、RAIDコントローラのファームウェアを利用可能な最新バージョンにアップデートすると、根本的な原因を解決できます。インストール手順をお読みくださいアップデートを開始する前に。

ディスクコントローラが応答を停止すると、コントローラの種類に関係なく、Linuxカーネルは自動的に最初にリセットを試みます。あなたの場合は、RAIDコントローラのブロックを正常に解除し、システムのクラッシュを防ぐようです。つまり、これは有効な解決策ですが、それに依存することは明らかに理想的ではありません。特にこのようなことが繰り返し発生する場合にはさらにそうです。

HPEでは、P420iは廃止された製品であると述べています。つまり、もはや新製品として製造および販売されていません。現在、ファームウェアのバージョンは2015年10月にリリースされたため、RAIDコントローラは現在約8年になるようです。大企業は、その時代の重要なx86サーバーを老化という理由だけで廃棄することを真剣に考えます。これらの古いサーバーに対するサプライヤーのサポートは、非常に高価であり、/またはスペアパーツを時期的に提供することが困難になるため、現在のハードウェアほど効果的ではないためです。

スペアパーツを調達できるような多くの類似サーバーがある場合は、エラーを直接処理することもできます。そうでなければ、良いバックアップと実行可能な計画があることを願っています。いつ（いいえもし）サーバーの一部のコンポーネントは最終的に失敗します。

Answer 1