NVIDIAドライバをインストールし、次の出力で確認しましたcat /proc/driver/nvidia/version
。
NVRMバージョン:NVIDIA UNIX x86_64カーネルモジュール390.30 Wed Jan 31 22:08:49 PST 2018 GCCバージョン:gccバージョン4.8.5 20150623(Red Hat 4.8.5-16)(GCC)
ところで、nvidia-smi
実行時に次のエラーが発生しました。bash: nvidia-smi: command not found...
追加情報:私はCentOS 7を実行しており、a)nvidia-smiを起動し、b)CUDAをインストールしようとしています。
答え1
3年1ヶ月前に質問しました
あなたは言う NVIDIAドライバをインストールしましたしかし、どのようにインストールしたか説明しませんでした。 NVIDIAドライバはカーネルモジュールであり、通常失われたカーネルの更新が発生すると、yum update
nvidiaカーネルモジュールが保持されないため(DKMSがインストールされていない場合)、nvidia機能は中断されます。
しかし、これは/usr/bin/nvidia-smi
コマンドが見つからないと言う理由を説明しません。それは別の話ですが、それはnvidia-smi
PATHにあるべきであり、/usr/bin
明らかにPATHにあるべきです。 NVIDIA経由で再インストールしてください。NVIDIAの実行文書は問題を解決します。
以下は私が好む方法RHEL / CentOS 7.xでNVIDIA(およびcuda)をインストールすることは私にとって効果的でした(約3年間)。
- nvidiaからダウンロードしてください
NVIDIA-Linux-x86_64-460.67.run
。 {グラフィックカードに合ったバージョンを入手してください}約150mb - nvidiaからダウンロードしてください
cuda_11.2.2_460.32.03_linux.run
(最新バージョンが2GBを超える場合) su
chmod 700
ルート;両方とも/rootにコピーします。systemctl set-default multi-user.target
reboot
またはsystemctl isolate multi-user.target
init 3
- /root/NVIDIA-Linux-x86_64-460.67.runを実行して{見てください。カーネルモジュールの構築部分}
- 正常にインストールされたら、
/usr/bin/nvidia-smi
そのプログラムが存在して動作する必要があります。 - その後、実行するか、
systemctl isolate graphical.target
グラフィックinit 5
コンソールが機能している場合はログインし、必要に応じてリセットsystemctl set-default graphical.target
します。 - すべてが正常に機能していることを確認するには、最後の再起動を実行することをお勧めします。
CUDAのインストールは基本的に同じプロセスです。
cuda.runファイルにバンドルされているnvidiaグラフィックドライバが常に最新のものではありません。
最新のnvidia.runドライバは、常にすべてのcudaバージョンで動作します。
cuda.runファイルにバンドルされているnvidiaグラフィックドライバをインストールする必要はないので、cudaをインストールするときにドライバを選択解除することをお勧めします。
答え2
私は職場でHPCクラスタを実行しており、cudaドライバRPMをインストールしました。 nvidia-smiを提供しますが、$INSTALL_ROOT/libs/440.64.00/binディレクトリにあります。 $INSTALL_ROOT はシステムごとに異なる可能性があるため、まず検索する必要があります。
名前にnvidiaを含むRPMではなく、cuda-driverというRPMを使用していることを覚えていたので、次のnvidia-smiツールを見つけました。
rpm-qa | grep -i cuda | grep -i cuda xargs rpm -ql | xargs rpm -ql grep
これにより、3つのパス名が提供されます(ここでINSTALL_ROOTを見ることができます)。
/cm/local/apps/cuda-driver/libs/440.64.00/bin/nvidia-smi /cm/local/apps/cuda-driver/libs/440.64.00/share/doc/NVIDIA_GLX-1.0/html/nvidia -smi.html /cm/local/apps/cuda-driver/libs/440.64.00/share/man/man1/nvidia-smi.1.gz
その後、そのうちの1つにrpm -qfを使用してRPM名を取得しました。
役に立ったことを願っています!
答え3
通常、新しいシステムで作業するとき - sudo アクセス権がある場合:
最初の試み
sudo apt-get install nvidia-cuda-toolkit または
sudo yum nvidia-cuda-toolkitのインストール
使用しているシステムによって異なります。
それでも問題が解決しない場合は、別の回避策を試してください。
sudoにアクセスできないシステムの場合は、公式ウェブサイトからドライバをダウンロードし、nvidia-driverを最初にインストールしてからcudaをインストールして同じドライババージョンを入手してください。
nvidia-smi
nvidia-utils
そのドライバのバージョンをインストールするために必要なパッケージの一部です。
例:nvidia-driver 440の場合はインストールする必要があります。sudo apt install nvidia-utils-440
クイックノートでは、apt-getの代わりに適性を使用します。
sudo apt install aptitude -y
sudo aptitude install -y nvidia-driver-535 nvidia-dmks-535