12コアLinuxシステムでroot権限を持たないユーザーとして、単一プロセスで作業を開始します。Ctrl-Z
プロセスをクリックすると、一時停止してkill -CONT
再起動します。これは素晴らしい作品です。
ただし、同じタスクを12個のスレッド(OpenMP)として実行している場合は、そのタスクをCtrl-Z
クリックするとコンピュータがシャットダウンされます(即時電源が切れます)。kill -STOP
プロセスに信号を送信するときも同じことが起こります。
これはカーネルバグかドライババグですか?この問題の原因をどのように見つけることができますか?
編集:これはデュアルソケット(2x6コア)を持ち、ハイパースレッディングのない6年のCentOSです。
Linux localhost.localdomain 2.6.32-642.6.2.el6.x86_64 #1 SMP Wed Oct 26
06:52:09 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux
/proc/cpuinfo
processor : 11
vendor_id : GenuineIntel
cpu family : 6
model : 44
model name : Intel(R) Xeon(R) CPU X5680 @ 3.33GHz
stepping : 2
microcode : 19
cpu MHz : 1596.000
cache size : 12288 KB
physical id : 1
siblings : 6
core id : 10
cpu cores : 6
apicid : 52
initial apicid : 52
fpu : yes
fpu_exception : yes
cpuid level : 11
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca
cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx
pdpe1gb rdtscp lm constant_tsc arch_perfmon pebs bts rep_good xtopology
nonstop_tsc aperfmperf pni pclmulqdq dtes64 monitor ds_cpl vmx smx est tm2
ssse3 cx16 xtpr pdcm pcid dca sse4_1 sse4_2 popcnt aes lahf_lm ida arat
epb dtherm tpr_shadow vnmi flexpriority ept vpid
bogomips : 6649.68
clflush size : 64
cache_alignment : 64
address sizes : 40 bits physical, 48 bits virtual
power management:
コメントの質問に対する編集者の回答は次のとおりです。
100%繰り返し可能です。 CentOSをアップデートし、コンピュータをある部屋から別の部屋に移動してから1ヶ月前に起動しました。
遅延なしですぐに発生します。 SIGKILLはうまくいきます。
これは計算およびI / Oプロセスです。