それでもメモリを消費していますが、それを使用するプロセスがないNVIDIA A100カードをリセットしようとしています。まず、NVIDIAカードを使用してすべてのプロセスを終了しました。
sudo fuser -k /dev/nvidia*
その後、リセットコマンドを実行します。
sudo nvidia-smi -r
しかし、まだGPUを使用するプロセスがあるという。実行すると、一部のプロセスとそのPIDが一覧sudo fuser -v /dev/nvidia*
表示されます。ただし、何も返されず(プロセス自体を除く)、生成された同じ存在しないプロセスが表示されます。gpustat
nvidia-smi
ps aux | grep $PID
grep
sudo kill $PID
kill: ($PID): No such process
lsof
もはや存在しないように見えるレコードにプロセスがまだ存在するのはなぜですか?