Dual P100 64Gカードを取り付けましたが、nvidia-smiまたはdeviceQueryでそれを認識できません。
私はデフォルトのUbuntuドライバと手動でインストールされたnvidia Webサイトドライバ(デフォルトドライバをクリーンアップした後)を試しましたが、成功しませんでした。フォローするこのアプリCUDAツールキットをインストールし、ユーティリティ(deviceQueryを含む)をコンパイルしますが、常にNo devices were found
。
以下はいくつかの出力です。
$ lspci -nn | grep 3D
03:00.0 3D controller [0302]: NVIDIA Corporation Device [10de:15fa] (rev a1)
04:00.0 3D controller [0302]: NVIDIA Corporation Device [10de:15fa] (rev a1)
$ nvidia-smi
No devices were found
$ cat /proc/driver/nvidia/version
NVRM version: NVIDIA UNIX x86_64 Kernel Module 460.32.03 Sun Dec 27 19:00:34 UTC 2020
GCC version: gcc version 9.3.0 (Ubuntu 9.3.0-17ubuntu1~20.04)
$ ./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
cudaGetDeviceCount returned 100
-> no CUDA-capable device is detected
Result = FAIL
ドライバとカード間のリンクを見つけることができる唯一の場所は/sys/bus/pci/drivers/nvidia
TeslaチップPCI ID0000:03:00.0
と0000:04:00.0
期待どおりに機能させるにはどうすればよいですか?
答え1
問題はハードウェアの問題でした。私の古いマザーボードは、このカードが持っている64Gのような十分なメモリアドレッシングをサポートしていませんでした。 Biosで「4G以上のデコード」を有効にし、CSMサポートを無効にする必要があり、私の既存のマザーボードは4G以上のデコードをサポートしません。
ASUS TUF x570 Plusでは、正しいBios設定で動作します!このカードを使用でき、nvidia-smiなどで見ることができます。
Nvidiaフォーラムで詳細を確認してください。