数分ごとに再起動するUnixサーバーがあります。説明したように、再起動が呼び出されたときにプロセスツリーを記録して問題の原因を追跡しました。この質問に対する答え。
しかし、次にどこを見るべきかわかりません。
ログには次の行(および他の複数行)が含まれています。
root 1 0 0 16:49 ? 00:00:00 /sbin/init
root 2894 1 0 16:53 ? 00:00:00 /bin/bash /sbin/shutdown -r now Control-Alt-Delete pressed
私にとっては、サーバーの起動プロセスがrestartを呼び出すようですshutdown -r
。システムログには次の行のみが表示されます。
sshd[2433]: Received signal 15; terminating.
また、これは私のIPアドレスからのみ接続を許可するAmazon Web Service Unixインスタンスです。また、秘密鍵で保護されています。
問題の原因を見つけるために取ることができる次のステップは何ですか?
答え1
まあ、何をしてもこんなになるじゃないか根したがって、/var/log/auth.log
誰かが次にログインしていることを確認してください。根または行政この期間中または使用中Sudoroot権限を取得するには。/etc/ssh/ssd_config
関連する詳細を取得するには、ロギングレベルを上げる必要があります。
他のものは次のとおりです。
- ボール
/etc/passwd
アカウント根または行政そして持って強く打つそのアカウントに対して定義されたシェル。ホームディレクトリがある場合は、.bashrcファイルに奇妙なものが定義されていることを確認してください。 - 起動時にマシンにどのデーモンがあるかを確認してください。バラよりこの投稿もっと学ぶ。これらのいずれかを再起動する理由がありますか?
- 次にログイン根そしてバッチジョブを確認してください
crontab -e
。あなたの例では、約5分後にセッションが再開されます。始めるものはありますか?予約されたことおおよその間隔でファイルを送信しますか?このキューのすべてのエントリは根ソースコードのソースがどこでも構いません。 - ハードウェア障害の可能性を排除するには、以下を起動してみてください。はいサーバーは別のAmazonにあります。エリア他のハードウェアでこれが起こるようにします。
- これですか?はいいつもこんなことをしたのでしょうか、それともどのくらい時間が経ってから始まったのでしょうか?バックアップはあります(Amazon急性心筋梗塞以前のバージョンに戻って、この動作がまだ表示されていることを確認できるように、タスク全体の一部を実行しますか?注:決して十分ではありません急性心筋梗塞バックアップしてください!