NVIDIAドライバがインストールされましたが、nvidia-smiはCentOSで実行されません。

NVIDIAドライバがインストールされましたが、nvidia-smiはCentOSで実行されません。

NVIDIAドライバをインストールし、次の出力で確認しましたcat /proc/driver/nvidia/version

NVRMバージョン:NVIDIA UNIX x86_64カーネルモジュール390.30 Wed Jan 31 22:08:49 PST 2018 GCCバージョン:gccバージョン4.8.5 20150623(Red Hat 4.8.5-16)(GCC)

ところで、nvidia-smi実行時に次のエラーが発生しました。bash: nvidia-smi: command not found...

追加情報:私はCentOS 7を実行しており、a)nvidia-smiを起動し、b)CUDAをインストールしようとしています。

答え1

3年1ヶ月前に質問しました

あなたは言う NVIDIAドライバをインストールしましたしかし、どのようにインストールしたか説明しませんでした。 NVIDIAドライバはカーネルモジュールであり、通常失われたカーネルの更新が発生すると、yum updatenvidiaカーネルモジュールが保持されないため(DKMSがインストールされていない場合)、nvidia機能は中断されます。

しかし、これは/usr/bin/nvidia-smiコマンドが見つからないと言う理由を説明しません。それは別の話ですが、それはnvidia-smiPATHにあるべきであり、/usr/bin明らかにPATHにあるべきです。 NVIDIA経由で再インストールしてください。NVIDIAの実行文書は問題を解決します。

以下は私が好む方法RHEL / CentOS 7.xでNVIDIA(およびcuda)をインストールすることは私にとって効果的でした(約3年間)。

  • nvidiaからダウンロードしてくださいNVIDIA-Linux-x86_64-460.67.run。 {グラフィックカードに合ったバージョンを入手してください}約150mb
  • nvidiaからダウンロードしてくださいcuda_11.2.2_460.32.03_linux.run(最新バージョンが2GBを超える場合)
  • suchmod 700ルート;両方とも/rootにコピーします。
  • systemctl set-default multi-user.target
  • rebootまたはsystemctl isolate multi-user.targetinit 3
  • /root/NVIDIA-Linux-x86_64-460.67.runを実行して{見てください。カーネルモジュールの構築部分}
  • 正常にインストールされたら、/usr/bin/nvidia-smiそのプログラムが存在して動作する必要があります。
  • その後、実行するか、systemctl isolate graphical.target グラフィック init 5コンソールが機能している場合はログインし、必要に応じてリセットsystemctl set-default graphical.targetします。
  • すべてが正常に機能していることを確認するには、最後の再起動を実行することをお勧めします。

CUDAのインストールは基本的に同じプロセスです。

cuda.runファイルにバンドルされているnvidiaグラフィックドライバが常に最新のものではありません。

最新のnvidia.runドライバは、常にすべてのcudaバージョンで動作します。

cuda.runファイルにバンドルされているnvidiaグラフィックドライバをインストールする必要はないので、cudaをインストールするときにドライバを選択解除することをお勧めします。

答え2

私は職場でHPCクラスタを実行しており、cudaドライバRPMをインストールしました。 nvidia-smiを提供しますが、$INSTALL_ROOT/libs/440.64.00/binディレクトリにあります。 $INSTALL_ROOT はシステムごとに異なる可能性があるため、まず検索する必要があります。

名前にnvidiaを含むRPMではなく、cuda-driverというRPMを使用していることを覚えていたので、次のnvidia-smiツールを見つけました。

rpm-qa | grep -i cuda | grep -i cuda xargs rpm -ql | xargs rpm -ql grep

これにより、3つのパス名が提供されます(ここでINSTALL_ROOTを見ることができます)。

/cm/local/apps/cuda-driver/libs/440.64.00/bin/nvidia-smi /cm/local/apps/cuda-driver/libs/440.64.00/share/doc/NVIDIA_GLX-1.0/html/nvidia -smi.html /cm/local/apps/cuda-driver/libs/440.64.00/share/man/man1/nvidia-smi.1.gz

その後、そのうちの1つにrpm -qfを使用してRPM名を取得しました。

役に立ったことを願っています!

答え3

通常、新しいシステムで作業するとき - sudo アクセス権がある場合:

最初の試み

sudo apt-get install nvidia-cuda-toolkit または

sudo yum nvidia-cuda-toolkitのインストール

使用しているシステムによって異なります。

それでも問題が解決しない場合は、別の回避策を試してください。

sudoにアクセスできないシステムの場合は、公式ウェブサイトからドライバをダウンロードし、nvidia-driverを最初にインストールしてからcudaをインストールして同じドライババージョンを入手してください。

nvidia-sminvidia-utilsそのドライバのバージョンをインストールするために必要なパッケージの一部です。

例:nvidia-driver 440の場合はインストールする必要があります。sudo apt install nvidia-utils-440

クイックノートでは、apt-getの代わりに適性を使用します。

sudo apt install aptitude -y

sudo aptitude install -y nvidia-driver-535 nvidia-dmks-535

関連情報