Ubuntu 16.04および4.4.0-137通常のカーネルを含むNVIDIA DevBoxが一晩ランダムに再起動して終了します。

Ubuntu 16.04および4.4.0-137通常のカーネルを含むNVIDIA DevBoxが一晩ランダムに再起動して終了します。

最近、ASUS BIOSでNVIDIA DevBoxを使用する方法と、上記のカーネルバージョンとUbuntuバージョンについて話しました。何らかの理由で、他のノートパソコンやコンピュータデバイスのように、デバイスを一晩放置することはできません。デバイスをデバイスの上に置くと、数分後に自動的にロックされるか、スリープモードになります。翌日、マウスを動かすかキーボードを押すとすぐに、コンピュータが「一時停止」または目覚め、すべてのプログラムが前日に終了したかのように開き、実行されます。

奇妙な理由から、このマシンではこれは発生しません。私より先にこの機器に1年ほど触れなかった以前のユーザーがいて省エネに関する一種の構成をしたかもしれませんが、電源オプションを確認してみると私の機器ではすべてが大丈夫に見えました(私は1時間一時停止して1時間眠ります。私が気づいた興味深いのは、昼食後にコンピュータがロック/一時停止された場合は問題なくセッションに戻りますが、一晩放置しておくと、次の日に戻り、次の日に戻ります。機械が自動的にシャットダウンしました。建物がロックされているため、夜に他の人が実際に電源を切るボタンを押すことができず、他のユーザーのコマンド履歴も確認しました(私たちは両方とも管理者権限を持ち、その人はコンピュータを使用していません)。リモートアクセスがオフの場合、ポップアップも表示されません。

電源装置の故障や損傷が発熱の問題を引き起こす可能性があることをさまざまな場所で読んだことがありますが、これが本当であるかどうかを確認できますか? psensorアプリがありますが、グラフィックカード(4枚あり)やマザーボードの温度を確認できるファイルに保存せずに温度だけをリアルタイムで記録するようです。

自動的にシャットダウンするマシンを診断する別の方法は何ですか?発熱の問題なのか停電なのか、どうすればわかりますか?それともカーネルの問題でしょうか?このコンピュータには、現在インストールされているNVIDIAドライバに加えて、実際に集中的なプログラム(ほとんど新しい)がインストールされていないので、Ubuntuを新しくインストールすることを検討できますか? - ハードウェアに問題があるとほとんど意味がありませんが、

他の細部:

NVIDIAドライバが正しくインストールされました。次のコマンドを強制的に実行すると、ドライバがバグを引き起こし、マシンが非常に正しく反応しなくなり、マシンが2日間連続してオンになります(これらのマシンでは非常に簡単です)。 5分後に点灯するのが難しくなります。夜中に行をランダムに再起動します。

$ unset autologoff

後でドライバを正しく再インストールし(自動ロギングオプションをリセットする必要があります)、システムが現在の状態に戻り、24時間以上何もしなかった場合(何もしない場合)、セルフシャットダウンが「必要」します。これは人の入力を受けませんが、バックエンドプロセスがまだ実行されている可能性があるためです。

  • マザーボード: ASUS EATX DDR4 LGA 2011-3 マザーボード X99-E WS/USB 3.1
  • CPU:Intel Xeon E5-2690 v4 2.6GHz 14コアLGA 2011プロセッサ135W
  • クーラー:Corsair HydroシリーズH80i v2極端なパフォーマンス液体CPUクーラー、ブラック。
  • 電源:EVGA SuperNOVA 1600 P2 80+ Platinum、1600W ECOモードフルモジュラーNVIDIA SLIおよびCrossfireサポート10年保証電源220-P2-1600-X1
  • グラフィックカード: 4 Titan X Pascal。

pci=noaerコンピューターでこのエラーが発生したことを確認したら、始めに以下を追加しました。https://askubuntu.com/questions/771899/pcie-bus-error-severity-Corrected

出力:

$ cat /proc/cmdline

はい

BOOT_IMAGE=/boot/vmlinuz-4.4.0-137-generic.efi.signed root=UUID=569dd2ad-c5a6-4ae4-a167-f849b8f6ae9e ro quiet splash pci=noaer vt.handoff=7

答え1

システムをUbuntu 18.04にアップロードして問題を解決しました。このエラーの原因はまだ検出されていませんが、グラフィックカード、BIOS、および16.04 Ubuntuバージョンとのカーネルの不一致に関連していると思われます。

関連情報