Ubuntu 14.04で実行されているWebサーバー(apache)があります。長年うまく働いてきました。 vmware ホストの仮想マシンです。約1ヶ月前に元のホストがクラッシュしたため、バックアップから新しいvmwareホストに復元しました。
昨日私はそれが要求を満たしていないことを発見しました。私は監視しているサーバーではないので、回復されてから実行されていた可能性があります。私のSSHは大丈夫ですが、「top」などのコマンドを実行すると中断されます。 Ctrl-Cを押してプロンプトに戻ることができますが、それはすべてです。
sshが機能しないため、vmwareを介してコンソールを開いて正常にコマンドを実行できることを確認しました。それで私たちは「sudo restart」をしました。再起動後、sshは再び正常に動作します。 Apacheもリクエストの処理を開始します。
そこから5分ごとにサーバーにネットワーク要求を送信するモニターを設定しました。 10~15分後、ウェブサイトが応答しないという通知が届きました。同じことが再び発生します。 SSHでは何もできませんが、コンソールを使用して再起動できます。残念ながら、再起動と再発生の間の期間のパターンを見つけることができませんでした。
sshは奇妙な動作をしますが、コンソールはうまく動作します。だから私はサーバーがスリープ状態に入るか、しばらくすると輻輳するように見えるトピックに焦点を当てたいと思います。
ところで、この問題が発生したときにコンソールで「top」を実行し、使用率が1%未満の最小CPUアクティビティを確認しました。記憶も同じだ。私はiotopが見ているものを見るのを助けるために問題が再び発生するのを待っています。しかし、今では何も止められないようです。
だから私の次の推測はそれが眠るということです。この場合、Ubuntuサーバーがスリープモードに設定されていることを確認するために何を探すべきかを教えてくれる人はいますか?それとも、何が起こっているのかについて別の提案がある人はいますか?
編集する:
この仮想マシンのホストの他のサーバーに異なる問題があるようです。したがって、これはホストまたはネットワークの問題に近いようです。私たちはこの問題を解決しようとするリソースがないので、新しいマシンを作ります。
答え1
可能なデバッグ戦略の提案は次のとおりです。
ライブLinuxメディアから広範なテストディスクを起動します。読み取り専用ディスクを持つことは、メディア破損の悪い症状です。運が悪く、ハードドライブのセクタエラーが発生しましたが、vmwareイメージがクラッシュしたシステムから来たという事実は、プライマリVMイメージ/ vmdkが破損しているか、悪い場合にバイナリが破損していることを意味します。
別のコンピュータに移行/再インストールします。いいえvmwareのインポート/エクスポートメカニズムを使用し、いいえVMDKのコピーもしvmware ホストで基本的な物理ディスク障害が見つかりません。
ファイルログの場合、カーネルがデータの整合性を保護するために読み取り専用マウントを有効にすると、もはや意味がありません。 syslogエラーを別のsyslog
サーバーと別の仮想コンソールにリダイレクトする(一部のディストリビューションでは、ログを仮想コンソールにリダイレクトします)基本的に)。幸運な場合は、原因に関する手がかりを提供できるエラーログを表示できます。
それともログについては言及していませんか?仮想マシンログ。根本的な物理ディスク障害がある場合は、vmwareログに表示されます。結局のところ、仮想マシンはvmwareハイパーバイザーが提供する仮想ディスクイメージのみを見ることができます。 vmware ターミナルコンソールに移動して観察します。可能であれば、vmwareログを別のsyslogサーバーにリダイレクトして定期的に確認してください。
継続的なメンテナンスについては、SNMPエージェントをインストールし、サボテン、観測所、または定期的なリソース使用量の基準を取得するために必要なものをすべて使用するのが最善です。これは問題が発生した場合にも役立ち、自動警告を送信することもできます。