memtesterの出力にメモリエラーが表示された場合はどうすればよいですか?

memtesterの出力にメモリエラーが表示された場合はどうすればよいですか?

Memtesterは次の応答を出力します。

memtester version 4.3.0 (64-bit)
Copyright (C) 2001-2012 Charles Cazabon.
Licensed under the GNU General Public License version 2 (only).

pagesize is 4096
pagesizemask is 0xfffffffffffff000
want 10240MB (10737418240 bytes)
got  10240MB (10737418240 bytes), trying mlock ...locked.
Loop 1/1:
  Stuck Address       : testing   1FAILURE: possible bad address line at offset 0x12325b7a8.
Skipping to next test...
  Random Value        : ok
FAILURE: 0xa003776ad640ac0c != 0xe003776ad640ac0c at offset 0x7a4f2680.
  Compare XOR         : FAILURE: 0xe7139f89d94112c0 != 0x27139f89d94112c0 at offset 0x7a4f2680.
FAILURE: 0x4e53ee3a9704bdf5 != 0x4a53ee3a9704bdf5 at offset 0x950b4930.
  Compare SUB         : FAILURE: 0x96ecab120464e9c0 != 0xd6ecab120464e9c0 at offset 0x7a4f2680.
FAILURE: 0x7f67022cef637b99 != 0x2b67022cef637b99 at offset 0x950b4930.
FAILURE: 0x96c38c9f6e6dd229 != 0xd6c38c9f6e6dd229 at offset 0xe40d2b50.
  Compare MUL         : FAILURE: 0x00000001 != 0x00000002 at offset 0x69394a08.
FAILURE: 0x00000001 != 0x00000000 at offset 0x950b4930.
FAILURE: 0x400000000000001 != 0x00000001 at offset 0xea6b07a8.
FAILURE: 0x400000000000000 != 0x00000000 at offset 0xfb853610.
FAILURE: 0x00000000 != 0x800000000000000 at offset 0x12bf3ed10.
  Compare DIV         : FAILURE: 0x777fd9f1ddc6c1cd != 0x777fd9f1ddc6c1cf at offset 0x69394a08.
FAILURE: 0x777fd9f1ddc6c1cd != 0x7f7fd9f1ddc6c1cd at offset 0x12bf3ed10.
  Compare OR          : FAILURE: 0x367600d19dc6c040 != 0x367600d19dc6c042 at offset 0x69394a08.
FAILURE: 0x367600d19dc6c040 != 0x767600d19dc6c040 at offset 0x7a4f2680.
FAILURE: 0x367600d19dc6c040 != 0x3e7600d19dc6c040 at offset 0x12bf3ed10.
  Compare AND         :   Sequential Increment: ok
  Solid Bits          : testing   0FAILURE: 0x4000000000000000 != 0x00000000 at offset 0x12325b7a8.
  Block Sequential    : testing   0FAILURE: 0x400000000000000 != 0x00000000 at offset 0xfb853610.
  Checkerboard        : testing   1FAILURE: 0xaaaaaaaaaaaaaaaa != 0xeaaaaaaaaaaaaaaa at offset 0x7a4f2680.
  Bit Spread          : testing   1FAILURE: 0xdffffffffffffff5 != 0xfffffffffffffff5 at offset 0x102e353e8.
  Bit Flip            : testing   0FAILURE: 0x4000000000000001 != 0x00000001 at offset 0x12325b7a8.
  Walking Ones        : testing  40FAILURE: 0xdffffeffffffffff != 0xfffffeffffffffff at offset 0x102e353e8.
  Walking Zeroes      : testing   0FAILURE: 0x400000000000001 != 0x00000001 at offset 0xea6b07a8.
FAILURE: 0x400000000000001 != 0x00000001 at offset 0xfb853610.
  8-bit Writes        : -FAILURE: 0xfeefa0a577dfa825 != 0xdeefa0a577dfa825 at offset 0x4bd600e8.
  16-bit Writes       : -FAILURE: 0xf3dfa5fff79e950b != 0xf7dfa5fff79e950b at offset 0x2b04cca8.
FAILURE: 0x3ffb3fc56e7532c1 != 0x7ffb3fc56e7532c1 at offset 0xe40d2b50.

Done.

明らかに、これはメモリ不足を示します。カーネルまたはハイパーバイザーでこのメモリを不良としてマークし、引き続き使用できますか?それともファイル13に入れて交換品を購入する必要がありますか?

答え1

エラーをかなり早く検出できない場合は、例えばECCメモリを使用するか、定期的に再起動してください。そしてmemtest、モジュールを交換するのが最善です。自動データ破損の危険があります。

オプションを使用して、カーネルがメモリを予約することによってメモリを無視するように指示できますmemmap(参照:カーネル文書細部):

memmap=nn[KMG]$ss[KMG]

[KNL、ACPI]特定のメモリを予約済みとしてマークします。予約するメモリ領域は〜ssですss+nn

例: 0x18690000-0x1869ffff からメモリを除外

memmap=64K$0x18690000

または

memmap=0x10000$0x18690000

一部のブートローダでは、Grub2などの「$」の前にエスケープ文字が必要になる場合があります。それ以外の場合は「$」と次の数字が食べられます。

ここで難しいのは、予約するアドレスの範囲を特定することです。memtester必要な物理アドレスと一致しない仮想アドレス空間からアドレスを提供しますmemmap

最も簡単な方法はstartを使用することですmemtest。次の内容が表示されます。

4c494e5558726c7a bad mem addr 0x000000012f9eaa78 - 0x000000012f9eaa80 reserved
4c494e5558726c7a bad mem addr 0x00000001b86fe928 - 0x00000001b86fe930 reserved
0x000000012f9eaa80 - 0x00000001b86fe928 pattern 4c494e5558726c7a

その後、カーネルは検出した誤った範囲を無効にします。引き続き開始を使用するかmemtest、予約されたアドレス範囲を使用してmemmapパラメータを設定できます。

答え2

あなたはそれを使用することができます悪い記憶修理する。しかし、モジュールを変更することをお勧めします。メモリはさらに悪化する可能性があり、音なしでデータが破損するのは非常に深刻な問題です。特にデータベースまたは暗号化を実行している場合、これは迅速に致命的になる可能性があります。

関連情報