サーバー - Ubuntu Bionic 18.04、アプリケーション - HAproxy。
私たちのアプリケーションサーバーの1つで、Webサービス(私たちの設定チームによって作成された単位ファイル)が突然消えました。 sshdサービスが失敗したことを知らせ、サーバーをコンソールして何が起こっているのかを調べてみると、ネットワークサービスが痕跡なく消えたことがわかりました。
ログ、dmesg、syslog、sarレポートなど、私が知っているすべての項目を確認しましたが、痕跡はありません。サーバーを再構築すると問題になりませんが、その間に何が起こったのかわからないというのは面倒です。
ログにはDNS障害、syslogサーバーに接続されていないなどの接続エラーのみが表示され、システムがこのような手がかりはありません。コアダンプも見えません。
どんなアドバイスでもとても役に立ちます!
ありがとう