リモートコンピュータにログインして、インストールされているグラフィックカードの数を確認しようとしました。このマシンはCUDA作業用に設計されているため、複数のNVIDIAカードがある可能性があります。
> lspci | grep -E "VGA|3D"
与えられた
02:00.0 3D controller: NVIDIA Corporation GF110GL [Tesla M2090] (rev a1)
03:00.0 3D controller: NVIDIA Corporation GF110GL [Tesla M2090] (rev a1)
0a:00.0 VGA compatible controller: Matrox Electronics Systems Ltd. G200eR2
83:00.0 3D controller: NVIDIA Corporation GF110GL [Tesla M2090] (rev a1)
84:00.0 3D controller: NVIDIA Corporation GF110GL [Tesla M2090] (rev a1)
これは4つの異なるグラフィックカードを意味しますか?それでは、これらのデバイスは何ですか?
> ls /dev/nvidia*
/dev/nvidia0 /dev/nvidia1 /dev/nvidia2 /dev/nvidia3 /dev/nvidiactl
答え1
nvidia-smi -L
Nvidiaの場合、これは私が望むことをすることがわかりました。
リストオプション:-L、--list-gpusシステムに接続されているGPUのリストを表示します。
> nvidia-smi -L
GPU 0: Tesla M2090 (UUID: GPU-29ca4022-cf9d-d39f-8c46-...)
GPU 1: Tesla M2090 (UUID: GPU-1e282221-0aac-9a10-a46c-...)
GPU 2: Tesla M2090 (UUID: GPU-5b912869-92d8-d599-7617-...)
GPU 3: Tesla M2090 (UUID: GPU-a6d833f2-18a2-7331-24bb-...)