Nvidia Tesla PH402デュアルP100カードはlspciには表示されますが、nvidia-smiには表示されません。

Nvidia Tesla PH402デュアルP100カードはlspciには表示されますが、nvidia-smiには表示されません。

Dual P100 64Gカードを取り付けましたが、nvidia-smiまたはdeviceQueryでそれを認識できません。

私はデフォルトのUbuntuドライバと手動でインストールされたnvidia Webサイトドライバ(デフォルトドライバをクリーンアップした後)を試しましたが、成功しませんでした。フォローするこのアプリCUDAツールキットをインストールし、ユーティリティ(deviceQueryを含む)をコンパイルしますが、常にNo devices were found

以下はいくつかの出力です。

$ lspci -nn | grep 3D
03:00.0 3D controller [0302]: NVIDIA Corporation Device [10de:15fa] (rev a1)
04:00.0 3D controller [0302]: NVIDIA Corporation Device [10de:15fa] (rev a1)

$ nvidia-smi 
No devices were found

$ cat /proc/driver/nvidia/version 
NVRM version: NVIDIA UNIX x86_64 Kernel Module  460.32.03  Sun Dec 27 19:00:34 UTC 2020
GCC version:  gcc version 9.3.0 (Ubuntu 9.3.0-17ubuntu1~20.04) 

$ ./deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

cudaGetDeviceCount returned 100
-> no CUDA-capable device is detected
Result = FAIL

ドライバとカード間のリンクを見つけることができる唯一の場所は/sys/bus/pci/drivers/nvidiaTeslaチップPCI ID0000:03:00.00000:04:00.0

期待どおりに機能させるにはどうすればよいですか?

答え1

問題はハードウェアの問題でした。私の古いマザーボードは、このカードが持っている64Gのような十分なメモリアドレッシングをサポートしていませんでした。 Biosで「4G以上のデコード」を有効にし、CSMサポートを無効にする必要があり、私の既存のマザーボードは4G以上のデコードをサポートしません。

ASUS TUF x570 Plusでは、正しいBios設定で動作します!このカードを使用でき、nvidia-smiなどで見ることができます。

Nvidiaフォーラムで詳細を確認してください。

https://forums.developer.nvidia.com/t/ph402-dual-p100-64g-rminitadapter-failed-memory-mapping-issue/173877

関連情報