私はそれぞれ12個のメモリモジュールとIPMI
コネクタを備えたSupermicroサーバーを持っています。すべてのサーバーで実行すると、memtest86
一部の破損したメモリ(チャンネルXスロットY / Z)が検出されました。また、IPMI ログでいくつかの情報を見つけることができます。マザーボードのメモリが破損しています(例:P2 - C1)。うーん、わかりました。サーバーに物理的にアクセスできる場合は、サーバーをシャットダウンして破損したメモリースティックを交換できます。
ただし、必要なのは、IPMIを介してメモリ破損が検出され、サーバーを再起動せずにサーバーに物理的にアクセスできない場合(サーバーが半日離れているため)、サーバーがメモリースティック/スロット/ユニットを無効にする必要があることです。 (再)衝突しません。memmap
破損したメモリースティックの破損したユニットインデックスを知ると、それが使用できることがわかります。しかし、IPMIログまたはLinuxでインデックスを取得できますか?または、どのスティックが不良かを知っている場合は、LinuxまたはIPMIでスティックまたはスロット全体を無効にできますか?