私たちの会社には約30〜40のLinux仮想マシンがあります。各Linux仮想マシンには3つのパーティションがあります。
時々、パーティションがいっぱいになり、1つ以上のアプリケーションがハングすることがあります。
30分ごとに実行されるcronjobバッチスクリプトを作成し、しきい値を超えると電子メールを作成できることを知っています。
しかし、デフォルトのLinuxには「監視または警告」インフラストラクチャが組み込まれていませんか?
答え1
この問題を解決するために設計されたオープンソース(および独自の)監視ツールがたくさんあります。彼らはLinuxのツールに依存し、これは最終的にカーネルのシステムコールに依存します。
一部のツールはデータの収集と監視に焦点を当て、他のツールは警告に焦点を当て、選択するツールは基本要件によって異なります。
警告および監視ツールの最もよく知られた例は次のとおりです。ナギオス。データの収集とプロットに重点を置いた他のツールには、警告機能が組み込まれています。サボテンそしてムニン。多数のマシンを含む大規模クラスターがある場合神経節おそらく最善の選択でしょう。
これらのツールはしばしばネットワーク監視システムと呼ばれます。Wikipediaには広範なリストがあります。。
ホイールを再発明するのではなく、このようなツールを見つけたり使用したりすることをお勧めします。
使用しているLinuxディストリビューションに応じて、これらのツールの1つ以上がディストリビューションリポジトリですでに利用可能であり、デフォルトで現在の環境をサポートするように構成されています。
答え2
「一般的なLinuxに組み込まれている」という言葉は、カーネルについて話していると仮定していますか?
カーネルにはそんなことはありません。また、デフォルトのディストリビューションにはデフォルトで何も含まれていません。du
Bashを使用してこれを簡単に実行するのに役立つ同様の基本ツールがあります。以下はいくつかのリンクです。
あなたはそのようなスクリプトを書く方法を知っていると言ったので、コードを提供しません。それにもかかわらず、ほとんどのシステム管理者はコアツールを好むでしょう。彼らはコアツールを理解し、強力な機能を提供し、使いやすいです。新しい「モニタリング」施設にはあなたの学習が必要です。