
時々明確な理由なく、画面が突然「黒」に変わり、1行のテキストのみが表示されます。
/dev/sda1: clean 1068388/64102400 files, 29744985/256399616 blocks
システムが再起動しようとしているようです。ただし、それ以降は何も起こらずにリセットボタンを押す必要があります。
このようなことが3回起こりました。午前中に一度再起動した後、大きなタスクは実行されませんでした(ブラウザのみを開いただけで再現できません)。過酷な負荷(ニューラルネットワーク訓練)では、このようなことは起こらなかったので、次のような熱問題ではないと確信しています。この投稿。
/var/log/kern.log
ファイルに次の疑わしい行が見つかりました
... [ 0.024000] tsc: Fast TSC calibration failed
...
... [ 0.796335] dpc 0000:00:01.1:pcie010: DPC error containment capabilities: Int Msg #0, RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 6, DL_ActiveErr+
最後の行が3回連続で出てくるのにどういう意味なのかわかりません。
私は実行しています:
- オペレーティングシステム:Ubuntu 18.04
- カーネル: 4.15.0-39-一般(x86_64)
- デスクトップ版:GNOME Shell 3.28.3
- ディスプレイドライバ:NVIDIA 396.45
- コンパイラ: Clang 3.3 + LLVM 3.3 + CUDA 9.2
- ファイルシステム:ext4
かなり新しいデスクトップの仕様は次のとおりです。
- プロセッサー: AMD Ryzen Threadripper 1900X 8コア @ 3.80GHz(16コア)
- マザーボード: ASRock X399 Professional Gaming
- メモリ: 64512MB
- ディスク: 1050GB Crucial_CT1050MX + 4001GB Elements SE 25FF
- グラフィックカード: 2x SLI NVIDIA GeForce GTX 1080 Ti 11264MB
この問題の原因は何ですか?
インテリジェント制御
コメントに応じて、出力は次のようになります。
sudo smartctl --all /dev/sda
はい
=== START OF INFORMATION SECTION ===
Device Model: Crucial_CT1050MX300SSD1
Serial Number: 173818DBA7DB
LU WWN Device Id: 5 00a075 118dba7db
Firmware Version: M0CR060
User C apacity: 1.050.214.588.416 bytes [1,05 TB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
Form Factor: 2.5 inches
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: ACS-3 T13/2161-D revision 5
SATA Version is: SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Sat Nov 17 14:39:52 2018 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 2783) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 13) minutes.
Conveyance self-test routine
recommended polling time: ( 3) minutes.
SCT capabilities: (0x0035) SCT Status supported.
SCT Feature Control supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 100 100 000 Pre-fail Always - 0
5 Reallocated_Sector_Ct 0x0032 100 100 010 Old_age Always - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 454
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 333
171 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0
172 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0
173 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 1
174 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 1
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 000 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
194 Temperature_Celsius 0x0022 074 059 000 Old_age Always - 26 (Min/Max 16/41)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 100 100 000 Old_age Always - 0
202 Unknown_SSD_Attribute 0x0030 100 100 001 Old_age Offline - 0
206 Unknown_SSD_Attribute 0x000e 100 100 000 Old_age Always - 0
246 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 945594898
247 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 29549867
248 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 8744251
180 Unused_Rsvd_Blk_Cnt_Tot 0x0033 000 000 000 Pre-fail Always - 4424
210 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
更新(黒い画面ではなくログアウト)
黒い画面が表示されるのではなく、理由がなくアカウントからログアウトされました。これらの質問が関連しているようです。このイベントの間、Vimは次の内容を強調しましたkern.log
。
Nov 19 09:44:52 Gauss kernel: [ 0.793729] dpc 0000:00:01.1:pcie010: DPC error containment capabilities: Int Msg #0, RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 6, DL_ActiveErr+
Nov 19 09:44:52 Gauss kernel: [ 0.793735] dpc 0000:00:03.1:pcie010: DPC error containment capabilities: Int Msg #0, RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 6, DL_ActiveErr+
Nov 19 09:44:52 Gauss kernel: [ 0.793744] dpc 0000:40:03.1:pcie010: DPC error containment capabilities: Int Msg #0, RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 6, DL_ActiveErr+
...
Nov 19 09:44:52 Gauss kernel: [ 0.890282] RAS: Correctable Errors collector initialized.
...
Nov 19 09:44:52 Gauss kernel: [ 1.026963] nvidia: module verification failed: signature and/or required key missing - tainting kernel
...
Nov 19 09:44:52 Gauss kernel: [ 2.927217] scsi 10:0:0:1: Failed to get diagnostic page 0x1
Nov 19 09:44:52 Gauss kernel: [ 2.927219] scsi 10:0:0:1: Failed to bind enclosure -19
...
Nov 19 09:44:52 Gauss kernel: [ 5.227132] EXT4-fs (sda1): re-mounted. Opts: errors=remount-ro
...
Nov 19 09:44:52 Gauss kernel: [ 5.602354] thermal thermal_zone0: failed to read out thermal zone (-61)
答え1
X11またはWayland GUIサーバーがクラッシュしてテキストモードコンソールに戻ったようです。 GUIモードに切り替える前にシステムを起動したときに実行されたファイルシステムチェックでは、1行のテキストが表示されることがあります。 Ubuntu 18.04は最初の仮想コンソールでGUIを起動するため、GUIサーバーがクラッシュして再起動しないと、仮想コンソールが応答しなくなります。
(他のLinuxディストリビューションでは、伝統的に7番目の仮想コンソールをGUIとして使用し、X11サーバーがクラッシュするとシステムが自動的にデフォルトの最初の仮想コンソールに戻り、機能的なログインプロンプトが表示されます。Ubuntuは明らかにGUIサーバーを使用しているようです)起動起動とGUIログイン間のよりスムーズな切り替えのための最初の仮想コンソールですが、GUIサーバーがクラッシュしている場合は、テキストモードログインプロンプトにアクセスするために仮想コンソールを知る必要があります。
すべての行は/var/log/kern.log
Linuxカーネルの起動後数秒以内に記録されます(各行の先頭の角かっこ内の起動後の秒数に基づいて)、直接的な関係がない可能性があります。
を押してみてくださいControl+Alt+F2。カーネルがまだ残っている場合は、黒い画面にテキストモードのログインプロンプトが表示されます。その後、ログインしてsudo systemctl restart gdm
GUIを再起動したり、テキストモードでログやその他のトラブルシューティング情報を収集したりできます。再起動するとgdm
自動的にGUIに戻ることができますが、2番目の仮想コンソールのログインセッションは引き続きログインしたままです。 2つのControl-Alt-F1コンソール間を使用して切り替えることができますControl-Alt-F2。
カーネルログには何も表示されないため、カーネルに問題はなく、デスクトップのみがクラッシュした可能性があります。この場合、追加のログファイルがより役に立ちます。
/var/log/gdm.log
/var/log/Xorg.0.log
それでは(まあ、Waylandと同等のものは何ですか?)
免責事項:私はUbuntu 18.04を直接使用したことがありません。この答えは私が読んだ内容に基づいています。
答え2
少し違うかもしれませんが、今日私のコンピュータで説明したのと同じ症状(衝突後の黒い画面ではなくログアウト)が発生しています。
私もUbuntu 18.04を使用しており、Nvidia GPUを使用しています。
誰もがこれがNvididaドライバに問題があると思うと述べたので、私はこのスレッドで答えを試してみることにしました。これは私たちの問題に部分的にのみ適用されますが、
NVIDIAドライバの削除
sudo apt-get purge nvidia*
再起動
Nvididaドライバを再インストールしてください
これまで黒い画面が出たり、突然ログアウトしたことはありません。
答え3
別の解決策があります。私は同じ問題に直面しましたが、私の場合に適切な提案ソリューションを見つけることができません。 VMware Workstationを使用しており、Ubuntuを起動すると同じ問題が発生しました。私の場合、競合の主な原因はグラフィックドライバやそれに似ていませんでした。 Ubuntuのインストールに空き容量が不足しています。だから問題を解決するために、次の手順を実行しました。
1) 次の行を追加して .vmx 構成ファイルを変更します。
BIOS.bootDelay = "50000"
*これにより開始遅延が長くなるため、Shift+Enter を使用して Grub メニューに入ることができます。
* Windowsで.vmxファイルを開く際に問題がある場合は、まずファイル拡張子を.txtに変更してから上の行を追加してファイルを保存し、拡張子を.vmxに戻してください。
2) VMware を実行し、Ubuntu を実行します。
3)画面をクリックし、Shiftキーを押しながらEnterキーを押してグラップメニューに入ります。
4) Ubuntu の詳細オプションを選択します。
5) ルートを選択し、Enter を押します。
6)これでrootアクセス権があるので、すべてのファイルを削除してUbuntuから空き容量を確保できます。
一部のユーザーは、Alt + Shift + F2またはF3を使用して端末にアクセスすることをお勧めします。 rootユーザーのパスワードがないため、これは機能しません。ただし、次の手順で問題を解決するのに役立ちました。
幸運、ハメッド
答え4
他の場所では見たことがなく、共有するのに役立つと思った別の解決策があります。
私はUbuntu 20.04 LTS、amd64 distroを使用しており、「/dev/sda1: clean...」エラーが表示された後、起動時に同じ問題が発生します。私の場合、問題の2番目の原因はディスクタイトチャーム。
したがって、このような症状が発生した場合は、パーティションに残りのスペースがどれだけあるかを少しdf
見てください。または、コマンドをdf -h
使用すると、大量のデータを含むディレクトリを表示できます。解決策は、不要なファイルを削除するのと同じくらい簡単です。du
du -h
しかし、私の場合、/var/logディレクトリは約100GB(?!)であることがわかりました。これは、/var/log/syslog ファイルが継続的に記録され、最終的にいっぱいになるシステムのいくつかの問題が原因で発生しました。運転。これが問題の主な原因です。現時点では、原因となるリソースが何であるかはわかりませんが、/var/log/syslog ファイルを確認すると状況をある程度知ることができます。このような場合は、/var/log/syslogファイルを正しく削除する方法を調べて、問題の主な原因を解決してください。
私のシステムに重要なものがないため、ログファイルをアーカイブすることに興味がないので、logrotateパッケージをインストールし、毎日の回転を設定し、回転したファイルを削除するようにシステムを設定しました。また、非常に大きなログファイルが見つかったため、1日より古いログファイルを削除するためにcronjobをrootに設定しました。crontab -e
rootでこれを行い、ファイルの末尾に次の行を追加できます。
0 * * * * Journalctl --vacum-time=1d
私も素敵なループを作りましたapt-get update
。apt-get upgrade
私はもっと読むことをお勧めします:
https://ma.ttias.be/clear-systemd-journal/
https://github.com/andyholmes/gnome-shell-extension-gsconnect/issues/588 https://askubuntu.com/questions/515146/very-large-log-files-what-should-i-do https://kifarunix.com/how-to-configure-log-rotation-with-logrotate-on-ubuntu-18-04-lts/
楽しいデバッグと幸運をお祈りします。
8bitrocks