fusionr -v /dev/nvidia* と lsof が応答しません。
A100システムには、停止してもメモリを割り当て続けるゾンビプロセスがあることがよくあります。私は通常、fuser -v /dev/nvidia*すべてのプロセスのPIDを決定し、使用または終了するためにこれkillを使用しますfuser -k /dev/nvidia*。 fuser結果を返すには常に時間がかかります。ただし、現在は合理的な時間に応答せず、コマンドは無期限にfuser -v中断されます。fuser -kたとえば、前回は週末に実行しましたが、戻りませんでした。最後にサーバーを再起動しました。 fuser -v /dev/nvidia0のような異...