icinga2が10分+ダウンタイムだけアラームを鳴らすにはどうすればよいですか？

2024-5-30 • tag-icon

私が経験している問題は、icinga2を実行しているホストとスキャンしている実際のサーバーシステム間の接続が少し不確実であることです。

したがって、時には1日に数分、予測不可能な時間にすべてのホストとサービスがダウンしているように見えます。

私はそれをしたくありません。私の考えでは、この問題に対する最善の解決策は何とか構築できることです。最小ダウンタイム、たとえば10分です。

ダウンタイムがこの値より長い場合にのみ警告を生成する必要があります。

明らかな副作用（警告遅延+短いネットワーク停止の監視不足）は私にとって問題ではありません。

変更しcheck_intervalてretry_interval組み合わせることができます。max_check_attempts

template Host "10mindowntime" {
  max_check_attempts = 10
  check_interval = 1m
  retry_interval = 1m
}

10分後、希望の詳細レベルに合わせて時間と試行を変更できます。

関連情報