破損したメモリを無効にする

破損したメモリを無効にする

私はそれぞれ12個のメモリモジュールとIPMIコネクタを備えたSupermicroサーバーを持っています。すべてのサーバーで実行すると、memtest86一部の破損したメモリ(チャンネルXスロットY / Z)が検出されました。また、IPMI ログでいくつかの情報を見つけることができます。マザーボードのメモリが破損しています(例:P2 - C1)。うーん、わかりました。サーバーに物理的にアクセスできる場合は、サーバーをシャットダウンして破損したメモリースティックを交換できます。

ただし、必要なのは、IPMIを介してメモリ破損が検出され、サーバーを再起動せずにサーバーに物理的にアクセスできない場合(サーバーが半日離れているため)、サーバーがメモリースティック/スロット/ユニットを無効にする必要があることです。 (再)衝突しません。memmap破損したメモリースティックの破損したユニットインデックスを知ると、それが使用できることがわかります。しかし、IPMIログまたはLinuxでインデックスを取得できますか?または、どのスティックが不良かを知っている場合は、LinuxまたはIPMIでスティックまたはスロット全体を無効にできますか?

関連情報