![ウォッチドッグハンドラ[閉じる]](https://linux33.com/image/46552/%E3%82%A6%E3%82%A9%E3%83%83%E3%83%81%E3%83%89%E3%83%83%E3%82%B0%E3%83%8F%E3%83%B3%E3%83%89%E3%83%A9%5B%E9%96%89%E3%81%98%E3%82%8B%5D.png)
私はLinuxシステム上で実行されているプロセスを監視し、プロセスが中断したり終わったり実行されている時期をすばやく確認することに興味があります。これを確認したら、いくつかのアクション(例:いくつかのデバッグ情報ダンプ、プロセスの再起動など)を実行したいと思います。
systemdを使用して中断されたプロセスを検出できることを知っていますが、残念ながらアクションを取ることはできません。一部のプロセスハートビートが失われたときに実行するスクリプトをどこで指定できますか?
Watchdog Monitorに似た他のツールをご存知ですか? (プロセスはここに登録してハートビート転送を開始でき、一部が欠落している場合はツールがアクションを実行します。
私は自分のツールを書くことができることを知っています。この機能を提供する他のツールがあるかどうか疑問に思います。
ありがとうアンドレア
答え1
problem->action
次のように、ほとんどの組み込みLinuxモニタリングツールが提供できるよりも多くの種類のモニタリング機能を備えた製品を探しているようです。
- トップ
- 仮想マシンの状態
- ラソフ
- TCPダンプ
- ネットワーク統計
- トップ
- オートフ
- iostat
http://www.zabbix.com/
または、同じhttp://www.nagios.org/
システム監視を確認することをお勧めします。私は現在、zabbixを使用して会社の複数のネットワークにある300を超えるユニークなホストを監視しています。カスタムモニタリングパラメータの作成に適しており、簡単に視覚的に監視し、問題を解決するために履歴データをチャートで表示することもできます。次の質問を作成することもできますactions
。 (これは実際の構文ではなく、単なるアイデアです。)if cpu>80% -> email [email protected] "There is a problem!"