Webサーバーのメモリリーク

Question

1分ごとにsarを起動し、psテーブルを出力します。私の詳細な答えを見るここ。

次にサーバーがクラッシュしたときの追跡sar -rに使用されます。いつそんなことが起こる。ここで、ps-cronjobまたは私の出力を使用してください。githubのps用Perlラッパー、どのプロセスが原因であるかを調べてください。

サーバーが12:00:00から13:00:00の間に爆発したとします。使用sar -r -s 12:00:00 -e 13:00:00。これにより、データが急増していることがわかります。（より簡単な場合は、プロットを実行するJavaベースのユーティリティがありますが、一般的に問題を引き起こす価値はありません。）次に、ps列の出力で時間範囲（例：12:00〜12:15）を検索し、pid、時間順に並べ替え、メモリ列を見てみましょう。

awk '/^=== .* 12:00:/,/^=== .* 12:16:/' /var/log/sa/ps/today |
 sort -k 1n -k 16

（ソートオプションでは、時間が16列にあると仮定していますが、そうでない場合もありません。）これで、awkを介してこの出力を再フィルタリングして、出力ライン間の違いを見つけることができます。

... | awk 'lastpid && lastpid==$1 && last != $0 { print} /^[0-9]/ { lastpid=$1;last=$0; }'

かなり粗雑なフィルターです。 mysql、postgresql、snmpdなど、コマンドラインが変更され続ける一部のプロセスでは、これはあまり役に立ちませんが、awkを調整して犯人を見つけるのに役立ちます。

Answer 1