Fedora 20 で Matlab 2012 を使用する場合、FFT の計算やグラフィックの描画の途中または後に次のような問題が頻繁に検出されます。
エラーメッセージは次のとおりです。
[ 635.157606] mce: [Hardware Error]: CPU 4: Machine Check Exception: 4 Bank 0: b650200000000135
[ 635.157606] mce: [Hardware Error]: TSC 22cd709f356 ADDR 5989fdd80
[ 635.157606] mce: [Hardware Error]: PROCESSOR 2:100fa0 TIME 1462430327 SOCKET 0 APIC 4 microcode 10000dc
[ 635.157606] [Hardware Error]: MC0 Error: Data/Tag DRD error.
[ 635.157606] [Hardware Error]: Error Status: System Fatal error.
[ 635.157606] [Hardware Error]: CPU:4 (10:a:0) MC0_STATUS[-|UE|-|PCC|AddrV|UECC]: 0xb650200000000135
[ 635.157606] [Hardware Error]:MC0_ADDR: 0x00000005989fdd80
[ 635.157606] [Hardware Error]: cache level: L1, tx: DATA, mem-tx: DRD
[ 635.157606] mce: [Hardware Error]: Machine check: Invalid
[ 635.157606] Kernel panic - not syncing: Fatal machine check on current CPU
[ 635.157606] Kernel Offset: 0x0 from 0xffffffff81000000 (relocation range: 0xffffffff80000000-0xffffffff9fffffff)
[ 635.157606] drm_kms_helper: panic occurred, switching back to text console
ソフトウェア(Matlabなど)、またはハードウェア(CPU、My CPUはAMD X6 1055T)のためですか?この問題をどのように解決できますか?
答え1
これはハードウェアエラーです。特に、これは検出されたが修正されていないECCメモリエラーでした。どのように知っていますか?上記の出力をパイプするmcelog --ascii
と、次のようになります。
Hardware event. This is not a software error.
CPU 4 0 data cache TSC 22cd709f356
ADDR 5989fdd80
TIME 1462430327 Thu May 5 02:38:47 2016
Data cache ECC error (syndrome a0)
bit45 = uncorrected ecc error
bit57 = processor context corrupt
bit61 = error uncorrected
memory/cache error 'data read mem transaction, data transaction, level 1'
STATUS b650200000000135 MCGSTATUS 4
CPUID Vendor AMD Family 16 Model 10
SOCKET 0 APIC 4 microcode 10000dc
(PROCESSOR
その行が含まれていない古いカーネルメッセージの場合は、実際のシステムで使用されているCPUの種類を知って指定する必要があります。ただし、その行を使用してシステムで出力を実行した場合はローカライズされます)。
答え2
ハードウェアエラー、CPU、またはメモリエラーのようです。別のCPUを使用したり、PCのメモリを交換したり、別のコンピュータ/ CPUで同じことを試したりできる場合は、ハードウェアの問題を解決できます。
また、他のハードウェアのBIOSとファームウェアもアップデートする必要があります。場合によっては、BIOSアップデートによってCPUマイクロコードが更新され、メモリ/CPUのバグを取り除くことができます。