オペレーティングシステム = CentOS 7.3
オプション(-h -lなど)を使用してこのサーバーで "df"コマンドを実行しようとすると、中断されてゾンビプロセスが残ります。 Ctrl+z を押してプロンプトに戻ることはできません。 FSTABで見つかった特定のマウントポイントに対して "df"を実行すると、コマンドは正常に実行されます(例:df / home)。
この問題をどのように解決できますか?
答え1
これは、ローカルファイルシステムの1つでシステムコールがロックされる症状です。
ローカルディスクはすぐに失敗し、再試行中に読み取りまたは書き込みが繰り返されます。
/var/log
ルートまたは/var
ファイルシステムがdf
ロックの原因でない場合は、システムログを表示して、どちらが原因であるかを確認できます。
答え2
再起動すると問題が解決しました。問題が再び発生するかどうかを確認する必要があるようです。 Dockerコンテナを構成し、さまざまなIPTables変更を実行するために複雑な構成スクリプトが実行されましたが、再起動は発生しませんでした。問題が再発した場合は、さらに詳しく調べてRCAを実行します。
dmesg ログにエントリが見つかりました。ご提案いただいた@Bobに感謝します。
[252869.529789]情報:ジョブdf:14958が120秒以上ブロックされました。 [252869.529838] "echo 0> /proc/sys/kernel/hung_task_timeout_secs"はこのメッセージを無効にします。