
私は専用のルートパブリックサーバーを持っており、CPU集約的な作業証明(マシンの8つのうち8つのCPUを使用)などのプロセス集約的なプログラムを実行するたびに、サーバーへのアクセス権を完全に失います。権限(ネットワークインタフェースを持つすべてのもの)sshd、apacheなどを含むアクセス権は失われます。)再度アクセスするには、プロバイダのコントロールパネルを介して強制的に再起動する必要がありました。
できるだけ低い優先順位である19で親近感を作ってみました。しかし、これは役に立ちません。
再起動すると、ログ(/var/log/syslog)にエラーはありません。再起動するまですべてが正常に表示されます。
この問題を調査するために私ができる他の方法はありますか?
答え1
シリアルコンソールログが最良の選択です。コントロールパネルでそのような機能が提供されていることを確認してください。そうでない場合は、静止したコンピュータのスクリーンショットにも役立つ情報が含まれる可能性があります。ネットワークコンソールより制限的ですが、場合によっては十分です。
答え2
はい、これが起こります。 1つの回避策は、niceを使用して問題のプロセスを実行して優先順位を下げることです(したがって、いくつかのログインサイクルを取得します)。しかし、メモリーも多用するとログインに必要なプログラムが押され、ユーザーも同じ問題に直面する可能性があります。