頻繁な分割エラーにより、ブラウザおよび/またはシステムがハングします。

頻繁な分割エラーにより、ブラウザおよび/またはシステムがハングします。

私はしばらく新しく作成したコンピュータにいくつかの問題を抱えていました。私はPop!_OSを選択することにしました(私はPop!_OSフォーラムを見ていないのでここに来ました)。 Pop!_OSは、多くのエンジニアリングおよびデータサイエンス関連ソフトウェアをサポートする必要があるためです。このコンピュータには、AMD®Ryzen 9 7900x 12コアプロセッサ×24とNVIDIA GeForce RTX 3060グラフィックカードが装備されています。

これまで私は/var/log/kern.logバックグラウンドで監視しており、ブラウザやプログラムがクラッシュするたびに、おそらくいくつかの分割エラーに関連していることがわかりました。

以下は、プログラムを停止する要因のおおよそのリストです。

chrome[9700]: segfault at 2d9b0303031a ip 000056081a8321db sp 00007ffcb1ad3580 error 4 in chrome[56081916f000+a492000] likely on CPU 17 (core 5, socket 0)

ThreadPoolForeg[12433]: segfault at 43168001 ip 000056081ff5485d sp 00007f73631fbba0 error 4 in chrome[56081916f000+a492000] likely on CPU 20 (core 10, socket 0)

gnome-shell[3019]: segfault at e641f8bf ip 00007f297b1f66d8 sp 00007ffe52033c60 error 6 in libmutter-clutter-10.so.0.0.0[7f297b1e0000+91000] likely on CPU 11 (core 13, socket 0)

Isolated Web Co[5349]: segfault at 8 ip 00007f79f7e1e861 sp 00007ffce6a71a10 error 4 in libxul.so[7f79f40be000+5e78000] likely on CPU 22 (core 12, socket 0)

VirtualBoxVM[5863]: segfault at 10 ip 00007f8cfe6a3b41 sp 00007ffc0591a670 error 6 in libc.so.6[7f8cfe692000+12b000] likely on CPU 19 (core 9, socket 0)

ibus-daemon[3165]: segfault at 20c4 ip 00007f7b14f6269d sp 00007ffc3272dee0 error 4 in libgobject-2.0.so.0.7200.4[7f7b14f48000+33000] likely on CPU 19 (core 9, socket 0)

私はWebサーフィンやビデオ通話を行うときに孤立したネットワーク障害を最も頻繁に経験します。

どこから始めるべきか、問題の範囲を絞り込む方法がわかりません。セグフォルトは引き続き発生するため、まずセグフォルトの原因を特定することに集中する必要があるようです。どんなアドバイスや指示でも役に立ちます。


修正する

私はsudo journalctl -b 0最新のリリースを調べて確認し、私が考えているすべてのエラーを取り除きました。

Oct 05 08:31:32 pop-os kernel: ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PCI0.GPP7.UP00.DP40.UP00.DP68], AE_NOT_FOUND (20230331/dswload2-162)
Oct 05 08:31:32 pop-os kernel: ACPI Error: AE_NOT_FOUND, During name lookup/catalog (20230331/psobject-220)

Oct 05 08:31:32 pop-os kernel: hub 8-0:1.0: config failed, hub doesn't have any ports! (err -19)

Oct 05 08:31:33 pop-os /usr/bin/nvidia-powerd[1202]: No matching GPU found
Oct 05 08:31:33 pop-os /usr/bin/nvidia-powerd[1202]: Failed to initialize RM Client
Oct 05 08:31:33 pop-os systemd[1]: nvidia-powerd.service: Main process exited, code=exited, status=1/FAILURE
Oct 05 08:31:33 pop-os systemd[1]: nvidia-powerd.service: Failed with result 'exit-code'.
Oct 05 08:31:33 pop-os systemd[1]: Failed to start nvidia-powerd service.

Oct 05 08:31:34 pop-os vboxdrv.sh[1979]: failed: Look at /var/log/vbox-setup.log to find out what went wrong.
Oct 05 08:31:34 pop-os systemd[1]: vboxdrv.service: Control process exited, code=exited, status=1/FAILURE
Oct 05 08:31:34 pop-os systemd[1]: vboxdrv.service: Failed with result 'exit-code'.
Oct 05 08:31:34 pop-os systemd[1]: Failed to start VirtualBox Linux kernel module.

Oct 05 08:31:35 pop-os gnome-session[2074]: gnome-session-binary[2074]: GLib-GIO-CRITICAL: g_bus_get_sync: assertion 'error == NULL || *error == NULL' failed
Oct 05 08:31:35 pop-os gnome-session[2074]: gnome-session-binary[2074]: GLib-GIO-CRITICAL: g_bus_get_sync: assertion 'error == NULL || *error == NULL' failed
Oct 05 08:31:35 pop-os gnome-session-binary[2074]: GLib-GIO-CRITICAL: g_bus_get_sync: assertion 'error == NULL || *error == NULL' failed

Oct 05 08:31:37 pop-os wpa_supplicant[1247]: bgscan simple: Failed to enable signal strength monitoring

Oct 05 08:40:40 pop-os systemd[3353]: app-gnome-gnome\x2dkeyring\x2dssh-3591.scope: Failed to add PIDs to scope's control group: No such process
Oct 05 08:40:40 pop-os systemd[3353]: app-gnome-gnome\x2dkeyring\x2dssh-3591.scope: Failed with result 'resources'.
Oct 05 08:40:40 pop-os systemd[3353]: Failed to start Application launched by gnome-session-binary.

Oct 05 08:40:42 pop-os gnome-shell[3601]: GNOME Shell started at Thu Oct 05 2023 08:40:41 GMT-0400 (EDT)
Oct 05 08:40:42 pop-os gnome-shell[3601]: Registering session with GDM
Oct 05 08:40:42 pop-os gsd-sharing[2148]: Error releasing name org.gnome.SettingsDaemon.Sharing: The connection is closed
Oct 05 08:40:42 pop-os gsd-rfkill[2159]: Error releasing name org.gnome.SettingsDaemon.Rfkill: The connection is closed
Oct 05 08:40:42 pop-os gnome-session-binary[2074]: GLib-CRITICAL: g_hash_table_foreach_remove_or_steal: assertion 'version == hash_table->version' failed

新しく起動した後、いくつかの異なる点が見つかりました。

Oct 05 22:22:49 pop-os kernel: FAT-fs (nvme0n1p1): Volume was not properly unmounted. Some data may be corrupt. Please run fsck.
Oct 05 22:22:49 pop-os kernel: FAT-fs (nvme0n1p2): Volume was not properly unmounted. Some data may be corrupt. Please run fsck.

Oct 05 22:22:49 pop-os kernel: nvidia: module license 'NVIDIA' taints kernel.
Oct 05 22:22:49 pop-os kernel: Disabling lock debugging due to kernel taint
Oct 05 22:22:49 pop-os kernel: nvidia: module license taints kernel.


アップデート - Memtest86の失敗

まあ、私はMemtest86テストスイートを正常に実行し、欠陥を発見しました。実際にはハードウェアの問題のようです。

ここに画像の説明を入力してください。

Memtest86はハードウェアの問題があるかどうかを識別できますが、どのデバイスに障害があるのか​​を識別できないようです。 RAMスティックの一方または両方に問題があるようです。

MemTest86が私のメモリでエラーを検出しました。私の記憶に何か問題があるのでしょうか?

MemTest86で報告されたすべてのエラーがメモリエラーによるものではありません。このテストは、CPU、L1およびL2キャッシュ、マザーボードを暗黙的にテストします。テストを実行すると、エラーが発生した原因を特定することはできません。しかし、ほとんどのエラーはメモリモジュールの問題が原因で発生します。そうでない場合、唯一のオプションは、欠陥が修正されるまで部品を交換することです。

皆様のご意見ありがとうございます。この時点で、一度に1つのRAMスティックを挿入してMemtestを再実行する必要がありますか?また、CPUをテストするために使用できる同様のツールがありますか?

いよいよこのコンピュータを購入してから数ヶ月にはなりませんでした。障害のあるハードウェアを特定できる場合は、OEMに交換するように依頼できますか?それともただ運がないのですか?

関連情報