Linuxカーネルパニックの原因の特定

Question 1

始めるには2つの提案があります。

あなたは最初のものが好きではありません。オーバークロックされたシステムがどんなに安定していると考えても、これが最初の疑いです。問題を報告する開発者なら誰でも同じことを言います。安定したテストワークロードは必ずしも同じコマンドを使用するわけではないので、とにかくメモリサブシステムに同じ量のストレスを加えます。オーバークロックを中止してください。人々が問題がオーバークロックに起因していないと信じるようにするには、オーバークロックが発生していないときに発生するようにして、クリーンなエラーレポートを取得できるようにします。これは、他の人が問題を解決するためにどれだけの努力をしているかに大きな影響を与えます。バグのないソフトウェアを持っていることは誇りに思っていますが、特にハードウェアの設定に問題がある人のレポートは残念で時間の無駄になる可能性があり、実際のバグとまったく関係がない可能性があります。

2番目は、あなたが言及した場所に移動しない申し訳ありませんデータを取得することです。実行中にのみ競合が発生した場合は、信頼できないカーネルがファイルシステムを破損させたくないので、考えよりも優れています。以下はいくつかの方法です。

使用ネットワークダンプネットワーク経由でサーバーに保存します。私は何年もこれをやったことがないので、このソフトウェアがまだ存在し、最新のカーネルで動作するかどうかはわかりませんが、簡単で試してみる価値があります。
シリアルコンソールの使用を開始します（アーカイブバージョン、現在のバージョン）、両方のコンピュータ（以前のコンピュータまたはUSBシリアルアダプタ）で動作するシリアルポートが必要で、出力を保存するように別のコンピュータを設定できるヌルモデムケーブルが必要です。
ダンプファイル最近は素敵な子どもたちが使っているようで、かなり柔軟に見えますが、設定が複雑に見えるので、私の好みではありません。簡単に言えば、何でもできる他のカーネルを起動し、以前のカーネルのメモリ内容を確認することが含まれますが、基本的にプロセス全体を構築する必要があり、固定されたオプションはあまり見られません。 修正する:実際、Ubuntuにはlinux-crashdumpという良いディストリビューションがあります。アーカイブバージョン、現在のバージョン）。

デバッグ情報がある場合は ksymoops(アーカイブバージョン、現在のバージョン^{（広告を含む）}）これを使用すると、アドレスをシンボル名に変換し、カーネルがどのように競合するかを理解できます。シンボリックダンプが何も意味がない場合は、少なくともここまたはLinuxディストリビューションのメーリングリスト/バグトラッカーに報告するのが役立ちます。

crashクラッシュダンプから入力を試み、log追加bt情報（パニックおよびスタックトレース中に記録された情報）を取得できます。あなたのFatal Machine check出身だと思います。ここ、しかし。コードに移動すると、プロセッサが報告します。機械検査例外- ハードウェアの問題。繰り返しますが、私の最初の賭けはオーバークロックによるものです。log詳細を知らせるより具体的なメッセージが出力にある可能性があります。

また、そのコードからmce=3カーネルパラメータで起動すると、競合が停止します。ただし、診断ステップを除いてはお勧めできません。 Linuxカーネルがこのバグがクラッシュする価値があると思うなら、おそらく正しいでしょう。

Answer

始めるには2つの提案があります。

あなたは最初のものが好きではありません。オーバークロックされたシステムがどんなに安定していると考えても、これが最初の疑いです。問題を報告する開発者なら誰でも同じことを言います。安定したテストワークロードは必ずしも同じコマンドを使用するわけではないので、とにかくメモリサブシステムに同じ量のストレスを加えます。オーバークロックを中止してください。人々が問題がオーバークロックに起因していないと信じるようにするには、オーバークロックが発生していないときに発生するようにして、クリーンなエラーレポートを取得できるようにします。これは、他の人が問題を解決するためにどれだけの努力をしているかに大きな影響を与えます。バグのないソフトウェアを持っていることは誇りに思っていますが、特にハードウェアの設定に問題がある人のレポートは残念で時間の無駄になる可能性があり、実際のバグとまったく関係がない可能性があります。

2番目は、あなたが言及した場所に移動しない申し訳ありませんデータを取得することです。実行中にのみ競合が発生した場合は、信頼できないカーネルがファイルシステムを破損させたくないので、考えよりも優れています。以下はいくつかの方法です。

使用ネットワークダンプネットワーク経由でサーバーに保存します。私は何年もこれをやったことがないので、このソフトウェアがまだ存在し、最新のカーネルで動作するかどうかはわかりませんが、簡単で試してみる価値があります。
シリアルコンソールの使用を開始します（アーカイブバージョン、現在のバージョン）、両方のコンピュータ（以前のコンピュータまたはUSBシリアルアダプタ）で動作するシリアルポートが必要で、出力を保存するように別のコンピュータを設定できるヌルモデムケーブルが必要です。
ダンプファイル最近は素敵な子どもたちが使っているようで、かなり柔軟に見えますが、設定が複雑に見えるので、私の好みではありません。簡単に言えば、何でもできる他のカーネルを起動し、以前のカーネルのメモリ内容を確認することが含まれますが、基本的にプロセス全体を構築する必要があり、固定されたオプションはあまり見られません。 修正する:実際、Ubuntuにはlinux-crashdumpという良いディストリビューションがあります。アーカイブバージョン、現在のバージョン）。

デバッグ情報がある場合は ksymoops(アーカイブバージョン、現在のバージョン^{（広告を含む）}）これを使用すると、アドレスをシンボル名に変換し、カーネルがどのように競合するかを理解できます。シンボリックダンプが何も意味がない場合は、少なくともここまたはLinuxディストリビューションのメーリングリスト/バグトラッカーに報告するのが役立ちます。

crashクラッシュダンプから入力を試み、log追加bt情報（パニックおよびスタックトレース中に記録された情報）を取得できます。あなたのFatal Machine check出身だと思います。ここ、しかし。コードに移動すると、プロセッサが報告します。機械検査例外- ハードウェアの問題。繰り返しますが、私の最初の賭けはオーバークロックによるものです。log詳細を知らせるより具体的なメッセージが出力にある可能性があります。

また、そのコードからmce=3カーネルパラメータで起動すると、競合が停止します。ただし、診断ステップを除いてはお勧めできません。 Linuxカーネルがこのバグがクラッシュする価値があると思うなら、おそらく正しいでしょう。

Question 2

a) rsyslog デーモンがカーネルメッセージをファイルに記録することを確認します。

vi /etc/rsyslog.conf

そして以下を追加してください

kern.*                 /var/log/kernel.log

rsyslogサービスを再起動してください。

/etc/initd.d/rsyslog restart

b) ロードされたモジュールを書き留めます。

`lsmod >/your/home/dir`

c）パニックは再現できないため、パニックが発生するのを待ちます。

d）緊急事態が発生した場合は、Liveまたは緊急CDを使用してシステムを起動します。

pvse) 影響を受けるシステムのファイルシステムをマウントします (/var および /home が別個のファイルシステムでない場合は通常 / で十分です)。（LVMを起動するために影響を受けるシステムでLVMを使用している場合は、コマンドを実行する必要があります vgs。）lvsmount -t ext4 /dev/sdXN /mnt

f）/mnt/var/log/適切なディレクトリに移動してkernel.logファイルを確認します。これにより、特定のモジュールまたは他のモジュールで緊急事態が発生したかどうかを判断するのに十分な情報を得ることができます。

Answer