週末の空き容量が不足し、Debian ベースのエージェントがクラッシュしました。再起動後に元気になったので、月曜日に土曜日の中断のログや説明を探しましたが、何も見つかりませんでした。
/var/log/*ですべての種類のコンテンツを見つけ、crontab、メールキューを確認してください...私が見つけた唯一のものはsyslogでシステムエコーを監視することです。空き容量は毎分重要になります(30分に約80GBが満たされます)。デーモンエラーなどはありません。
リアルタイムで何が起こっているのか理解するのに問題はありませんが、過去にこれらの問題をさらにデバッグする方法がわかりません。どんな提案がありますか?
このようなことは1年余りで初めてです。稼働時間は短く、次の数日間問題は再発しませんでした。
ありがとう
答え1
あなたはそれを使用することができますatop
このようにデバッグします。 atopはリアルタイムで実行されますが、より重要なのは、ログにキャプチャされた過去のスナップショットを表示して分析できることです。いろいろな指標を記録するので、後で「くそー、それを記録してほしい」とは思わないでしょう。 :-)
Debian では、apt-get install atop
.init マネージャを使用して起動時に起動して有効にできます。たとえば、systemd ではsystemctl enable atop && systemctl start atop
atop がロギングを開始します。一般的に/var/log/atop/<date>
。
履歴ログを表示するために使用しatop -r <log file>
、前方に表示するために使用しt
、後方に表示するために使用できますT
。?
キーを 。
ディスクに大量のデータを書き込むアプリケーションを見つける必要があります。 WRDISK列でこれを確認できます。ディスク使用量に基づいてソートすることもできますD
。
明らかに、これは録音が始まる前に戻ることはできませんが、次に正しく調査するためにバックグラウンドで実行して録音することができます。
答え2
また、特にlsof $partition_var_lives_on | grep deleted >> somefile
。