何百ものホストのデフォルトパラメータを監視する[閉じる]

何百ものホストのデフォルトパラメータを監視する[閉じる]

EC2 と Google Compute Engine には、何百もの Linux 仮想マシンがあります。できるだけ簡単で軽量な方法で、ディスクの空き容量やメモリ消費などの基本情報を監視したいと考えていました。負荷の変化などによって仮想マシンが頻繁に現れ、消えることが予想されます。

現在、簡単なスクリプトを使用してSNMPを介してこの情報を抽出しています。すでにアプリケーション固有の方法で提供されているため、カラフルなアプリケーション固有のモニタリングは不要です。

Zenossを試してみましたが、使いにくく、文書が不足していました。

私たちはNagiosとその派生物を考えました。私たちはSensu(しかし私の上司はRabbitMQが好きではない)とGangliaを考えましたが、どちらも私たちの最も基本的な要件に比べて複雑すぎるようです。

CirconusのようなSaaSソリューションは、私たちが持っているホストの数に比べて高すぎます。

私は明らかなものを見逃していますか?シンプル解決策はここにありますか? [反対]何をお勧めしますか?

答え1

オープンソースの方向にもう少し注意を払うと、オープンネットワーク管理あなたのニーズに合うかもしれません。私は自分で使ったことはありませんが(特にNagiosが好きではない人から)良いニュースを聞きました。私が理解したのはSNMPベースでもあります。

答え2

私の考えでは集めたプライマリAMIに追加でき、中央コレクタにデータを送信するため、EC2の要件に特に適しています。

これにより、新しいインスタンスがすぐにデータ転送を開始するため、監視システムを追加および削除して継続的に調整する必要がなくなります。

使用石黙データを収集し、単純なnagios設定またはcronジョブスクリプトを介して「normal」以外の値があることを確認します。

この基盤では、簡単に成長することができます。

答え3

私が個人的に一番好きなのはWhatsUpゴールドプレミアム

低コスト、SNMPベース、非常に優れた(歴史的)描画機能を備えています。マウスを上げると、その瞬間の実際の読み値が表示されます。

唯一の欠点は、WindowsサーバーとMS-SQLデータベース(無料の軽量バージョンが付属)が必要であることです。

これはあなたのような小規模な環境のための商用ソリューションです。

関連情報