以下のリンクに記載されているようにGPUDirect RDMAを実行しようとしています。私はQuadro M4000 GPUとCUDA 12.0ツールバーを含むX86 Linux PCを使用しています。ドライバの構築とCUDAプログラミングの実行中に、次のエラーが発生します。
カーネルモジュールを構築するためにコマンドを実行すると、./build-for-pc-native.sh
次のエラーが発生します。
Building modules, stage 2.
** MODPOST 1 modules**
**FATAL: parse error in symbol dump file
scripts/Makefile.modpost:92: recipe for target ‘__modpost’ failed
make[2]: *** [__modpost] Error 1
Makefile:1678: recipe for target ‘modules’ failed
make[1]: *** [modules] Error 2
make[1]: Leaving directory ‘/usr/src/linux-headers-5.4.0-136-generic’
Makefile:19: recipe for target ‘modules’ failed
make: *** [modules] Error 2**
上記のエラーを防ぐためにコマンドを実行し、モジュールを./build-for-any-no-cuda-native.sh
ビルドしてロードしました。ところで、client-applications/./build-for-pc-native.sh
ユーザアプリケーションに対してコマンドを実行すると、エラーが再び発生します。
make: Nothing to be done for ‘default’
上記のgithubリンクで提供されているデータアクセステストを実行すると、このエラーは無視され、コマンドを実行してもエラーは表示されません./rdma-malloc
。ただし、このコマンドを実行すると、./rdma-cuda
次のエラーが発生します。
ioctl(PIN_CUDA src) failed: ret=-1 errno=22.
この操作を再実行したときにset leds test
コマンドを実行しましたが、./set-leds 7
エラーが発生しました。
open() failed: Permission denied
ただし、コマンドの前にこの単語を使用するとsudo
エラーは発生しません。
上記のエラーの原因と発生原因をご存知ですか?このトピックに答えてください。