サーバーを再起動してmemtest(例:1〜2回)を実行し、Linuxで再起動し、いくつかのログにレポートを記録する方法はありますか?
Windows Server 2012のこの機能は、リモートサーバーのRAMエラーを診断するのに何度も役立ちましたが、Linuxサーバーの方法はGoogleにありません。
答え1
一つあるカーネルコマンドラインパラメータメモリ全体をテストし、起動順序の一部として不良ブロックをロックします。これは〜するボックスが応答しないように見えるように、開始順序に数分を追加します。
memtest= [KNL,X86,ARM,M68K,PPC,RISCV] Enable memtest Format: <integer> default : 0 <disable> Specifies the number of memtest passes to be performed. Each pass selects another test pattern from a given set of patterns. Memtest fills the memory with this pattern, validates memory contents and reserves bad memory regions that are detected.
不良ブロックがどこにあるかを知ったら、badram=
パラメータを使用してLinuxカーネルに不良ブロックがある場合はこれを回避できます。悪い記憶修理する。また、見ることができますMemTest86+エラー表示に基づいて正しい不良RAMセクタをブラックリストに追加するには?
しかもオンラインユーザ空間メモリテスタ -メモリテスター、IPMIに直接移動することもできます。 (半分のまともなサーバーの不良RAMにフラグを立てる必要があります。Intelサーバーでは、IPMIで見つかったECCエラーがsyslogに書き込まれます。)