これがDebianの問題かハードウェアの問題かはわかりませんが、情報はLinuxにあります。
Dell Inspiron 520(AMDチップ)にDebian 6.7をインストールしました。私は次のようにCPU情報を取得します。
less /proc/cpuinfo
これにより
processor : 0
vendor_id : AuthenticAMD
cpu family : 16
model : 6
model name : AMD Athlon(tm) II X2 250 Processor
stepping : 3
microcode : 0x10000b6
cpu MHz : 800.000
cache size : 1024 KB
physical id : 0
siblings : 2
core id : 0
cpu cores : 2
apicid : 0
initial apicid : 0
fpu : yes
fpu_exception : yes
cpuid level : 5
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm 3dnowext 3dnow constant_tsc rep_good nopl nonstop_tsc extd_apicid pni monitor cx16 popcnt lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs skinit wdt hw_pstate npt lbrv svm_lock nrip_save
bogomips : 6000.65
TLB size : 1024 4K pages
clflush size : 64
cache_alignment : 64
address sizes : 48 bits physical, 48 bits virtual
power management: ts ttp tm stc 100mhzsteps hwpstate
processor : 1
vendor_id : AuthenticAMD
cpu family : 16
model : 6
model name : AMD Athlon(tm) II X2 250 Processor
stepping : 3
microcode : 0x10000b6
cpu MHz : 800.000
cache size : 1024 KB
physical id : 0
siblings : 2
core id : 1
cpu cores : 2
apicid : 1
initial apicid : 1
fpu : yes
fpu_exception : yes
cpuid level : 5
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm 3dnowext 3dnow constant_tsc rep_good nopl nonstop_tsc extd_apicid pni monitor cx16 popcnt lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs skinit wdt hw_pstate npt lbrv svm_lock nrip_save
bogomips : 6000.02
TLB size : 1024 4K pages
clflush size : 64
cache_alignment : 64
address sizes : 48 bits physical, 48 bits virtual
power management: ts ttp tm stc 100mhzsteps hwpstate
温度を監視するためにpsensorを設置した。 CPU温度を50℃未満に保ちながら、100%の使用量に達することができます。ただし、長期間実行され、CPU集約型アプリケーションの場合は、次のようになります。
sudo maldet --scan-all /
アプリケーションが完了する前にコンピュータがシャットダウンされます。ある瞬間、電源インジケーターが点灯し続けている間、デスクトップから音が高く音が鳴りました。 CPUサーマルグリースをArctic Silverに交換しました。通常動作時のCPU使用量が100%であっても、温度は46度程度まで上昇します。コンピュータの側面を取り外してもCPUの温度は大きく変わりません。
私は走った
sudo dmidecode |grep -B 2 Stat
そして得た
Serial Number: DST5MS1
Asset Tag:
Boot-up State: Safe
Power Supply State: Safe
Thermal State: Safe
Security Status: None
--
Max Speed: 3000 MHz
Current Speed: 3000 MHz
Status: Populated, Enabled
--
Handle 0x0017, DMI type 32, 20 bytes
System Boot Information
Status: No errors detected
私が入るとき
sensors
私は持っています
k10temp-pci-00c3
Adapter: PCI adapter
temp1: +16.5°C (high = +70.0°C)
it8720-isa-0a10
Adapter: ISA adapter
in0: +1.07 V (min = +0.00 V, max = +4.08 V)
in1: +1.10 V (min = +0.00 V, max = +4.08 V)
in2: +3.02 V (min = +0.00 V, max = +4.08 V)
+5V: +3.01 V (min = +0.00 V, max = +4.08 V)
in4: +3.33 V (min = +0.00 V, max = +4.08 V)
in5: +2.14 V (min = +0.00 V, max = +4.08 V)
in6: +2.14 V (min = +0.00 V, max = +4.08 V)
5VSB: +2.96 V (min = +0.00 V, max = +4.08 V)
Vbat: +3.25 V
fan1: 816 RPM (min = 0 RPM)
fan2: 888 RPM (min = 0 RPM)
temp1: +23.0°C (low = -1.0°C, high = +127.0°C) sensor = thermal diode
temp2: +33.0°C (low = -1.0°C, high = +127.0°C) sensor = thermal diode
temp3: -128.0°C (low = -1.0°C, high = +127.0°C) sensor = disabled
cpu0_vid: +0.375 V
intrusion0: ALARM
電源を変えました。これ
私はそれを実行してストレステストすることにしました
sudo maldet --scan-all /
ターミナルウィンドウで。この呼び出しは数時間実行でき、多くのCPUリソースを消費します。 psensorのファン1が突然830から770に落ち、ゆっくりと上昇し始めた。しかし、CPU温度は摂氏30度以上から40度以上に徐々に高まった。夜に寝ると、Maldetteは1/4ほど完成し、温度は40度半ばでした。翌朝、コンピュータが動作を停止しました。単にカーソルだけではありません。パソコンでウェブサイトを実行していますが、アクセスできません。
Gnomeデスクトップの問題を解決するために、Debianを再起動してctrl-alt-F4を押してデフォルトのコマンドラインを入力しました。それから私は走った。
sudo maldet --scan-all /
数時間実行され、コンピュータはかなり高い音を出し始め、大きな音で文句を言い、画面に変わり続けるランダムなテキストがたくさんありました。それがどこから来たのかを言うのは難しいです。ハードを抜いた後、文字は止まったのですが、稲妻の音は聞こえず、電源の問題ではないかと疑ってみました。
再実行を始めましたが、今回はPSUであることを確認するために、PCの外部のPSUを使用しました。約1時間ほど過ぎて画面に下のようなフレーズが出ました。 (スクロールして見えなくなったので、最初の数行を逃した可能性があります。)
test_tsk_need_resched
check_preempt_cur
ttwu_do_wakeup
x86_pmu_config_addr
paravirt_write_msr
perf_ctx_adjust_freq
read_tsc
timekeeping_get_ns
ktime_get_update_offsets
hrtimer_interrupt
test_tsk_need_resched
resched_tsk
check_preempt_curr
ttwin_do_wakeups
smp+apic_timer
apic_timer_interrupt
copy_pte_range
copy_page_range
dup_mn
copy_process
do_fork
stub_clone
system_call_fastpath
この時点で、PCはキーボードEnterに応答しません。
編集する:
メモリテストをしてみる
sudo /usr/bin/memtester 5 1
そして得た
memtester version 4.2.2 (64-bit)
Copyright (C) 2010 Charles Cazabon.
Licensed under the GNU General Public License version 2 (only).
pagesize is 4096
pagesizemask is 0xfffffffffffff000
want 5MB (5242880 bytes)
got 5MB (5242880 bytes), trying mlock ...locked.
Loop 1/1:
Stuck Address : ok
Random Value : ok
Compare XOR : ok
Compare SUB : ok
Compare MUL : ok
Compare DIV : ok
Compare OR : ok
Compare AND : ok
Sequential Increment: ok
Solid Bits : ok
Block Sequential : ok
Checkerboard : ok
Bit Spread : ok
Bit Flip : ok
Walking Ones : ok
Walking Zeroes : ok
8-bit Writes : ok
16-bit Writes : ok
Done.
答え1
CPUクーラーがしっかりと締め付けられていることを確認し(合成または不足しているかどうかを確認)、ファンを確認し、メモリがこのコンピュータの原因であることを発見し、新しい電源装置でテストすることも悪くありません。すべてのインジケータは、可能なハードウェアの問題を示します。
答え2
これがどのようにソフトウェアの問題であるかを理解できません。その騒音を追跡する必要があります。 PSUが新製品であり、この問題が交換品として使用されている場合でも、これは原因ではない可能性があります。
あまり関係ありませんが、ディスクではなくCPUだけにストレスを与える作業を試してみましたか?あなたはそれを使用することができます:
pyrit benchmark_long
システムがクラッシュする前にカーネルログを確認してください。おそらく有用なものがあるでしょう。
ソフトウェアに関係がないかどうかを確認するには、LinuxブートCDを入手してストレステストを実行してください。競合が発生すると、ハードウェアの問題である可能性が高くなります。あるいは、別のオペレーティングシステムを試してみると良いでしょう。
ストレステスト中に温度を観察し続け、dmesgまたはカーネルログのエラーメッセージを慎重に調べてください。
編集する
メモリエラーが原因で同様の問題が発生する可能性があります。 memtest86を試してください。過去には私にとって効果的でした。オペレーティングシステムに関係なく起動可能なCDです。全部キャッチそうです。