ディスクレスクライアントが起動後24時間以内にnfsrootサーバーへの接続が失われる状況があります。最初は、Centos6からCentos7に16個のブレードを同時にアップグレードし(nfsrootディスクレス/pxeブートを使用)、正しくブートして12時間以上実行した後、すべて同時に切断されたため、これがハードウェアに関連していると思いました。これにより、すべてのコンソールに「120秒以上ブロックされたジョブ」が印刷されます。ブレードの1つをローカルディスクから起動するように設定しましたが、問題の再現中にディスクレスブレード15個は説明したように失敗しましたが、ブートディスクのあるブレードは以前と同じように実行され続けました。 nfs サーバーは引き続き他のクライアントにうまくサービスを提供します。
ディスクレスブレード(M1000eシャーシのDell M620)でnfsroot接続が切断されたという結論に達しました。メッセージファイルの両端に興味深いコンテンツは記録されません。 Centos6から7にすべての変更が行われたので、これがハードウェアの問題ではないと思いますが、互換性の問題があると思います。ハードウェアはCentos7をサポートすると主張しています。
nfsroot接続が失われた理由をデバッグする良い方法を提案できる人はいますか?カーネル=3.10.0-1160.59.1.el7.x86_64
答え1
解決された解決策/解決策:nfsサーバーとの接続を切断するには、dhcpd.confに次の行を追加します。
default-lease-time infinite;
max-lease-time infinite;
バグレポートで提案したとおりhttps://bugzilla.redhat.com/show_bug.cgi?id=1132396