最後の3日の夜00:00 UTCにサーバーが応答を停止し、すべてのサービスが停止し、サーバーの負荷が1800-3500に達し、プロセッサが24しかありません。 WHMスタートページからのみログインでき、SSH経由で接続できません。 WHM Process Managerでは、多くのps -fe
プロセスが0%から13400%まで多くの負荷を占めていることがわかります。同様のエラーが発生しました。2019/02/06 01:00:10 [crit] 24232#0: accept4() failed (23: Too many open files in system); proftpd[3208]: 213.136.76.210 - error: unable to accept an incoming connection: Too many open files in system; kernel: [82478.961892] VFS: file-max limit 131072 reached; [Wed Feb 06 01:39:35 2019] [emerg] (23)Too many open files in system: Couldn't create pollset in child; check system or user limits
また、昨日、lsofを使用した後も、次のような行がたくさんありました。
sshd 31611 root mem REG 8,2 124624 152567850 /lib64/libselinux.so.1
sshd 31611 root mem REG 8,2 22536 152568210 /lib64/libdl-2.12.so
sshd 31611 root mem REG 8,2 58480 152567836 /lib64/libpam.so.0.82.2
sshd 31611 root mem REG 8,2 144208 152568295 /lib64/libaudit.so.1.0.0
sshd 31611 root mem REG 8,2 43256 152567966 /lib64/libwrap.so.0.7.6
sshd 31611 root mem REG 8,2 12688 152567978 /lib64/libfipscheck.so.1.1.0
sshd 31611 root mem REG 8,2 157072 152567862 /lib64/ld-2.12.so
この問題の原因が実際に見つかりませんでした。 CENTOS 6.7 で WHM v76.0.18 を実行しています。
答え1
問題を再現できる場合:
cron
現在実行中のジョブがあることを確認し、そのジョブが何をしているかを確認します。パッケージの一部ではありませんが、自分や他のユーザーが作成したスクリプトに特別な注意を払ってください。ps -fe
複数のプロセスの親プロセスを確認してください。たぶん、どこかで問題のあるスクリプトを見つけたかもしれません。
実行中のsshd
プロセスで複数のライブラリを開くことは通常の動作ですが、実行中のプロセスが多い場合は問題があることを示している可能性があります。