Debian 9のCUDA - ツールキットはどこにありますか?

Debian 9のCUDA - ツールキットはどこにありますか?

Debian 9にCUDAをインストールする方法についていくつかのチュートリアルに従いました。

nvcc今まで私が使ってきたことの中で一番良いのはこのリンク

今問題は、ツールキットが見つからないことです。コマンドなどを使ってみましたが、find何もありません。もしツールキットがどこにあるのか知っている人はいますか?

これはnvcc、CUDAを使用して単純な "Hello World"プログラムを実行してコンパイルするたびにライブラリが見つからないため、エラーが発生するためです。サンプルをインストールしようとすると、ツールキットのパスを求めるメッセージが表示されますが、見つかりません。

次に追加:

以下を使用してすべてをインストールしました。

apt-get install nvidia-cuda-dev nvidia-cuda-toolkit  nvidia-driver 

その後、私は以下を実行しました。

nvcc -V

nvccがインストールされていることを確認するための出力は次のとおりです。

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Sun_Sep__4_22:14:01_CDT_2016

Ubuntu 16.04およびCUDA 8.0用の.runファイルをダウンロードしました。

cuda_8.0.61_375.26_linux-run

ドライバのインストールとツールキットのインストールをスキップし、サンプルインストールに直接進みます。

Do you accept the previously read EULA?
accept/decline/quit: accept

You are attempting to install on an unsupported configuration. Do you wish to continue?
(y)es/(n)o [ default is no ]: y

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 375.26?
(y)es/(n)o/(q)uit: n

Install the CUDA 8.0 Toolkit?
(y)es/(n)o/(q)uit: n

Install the CUDA 8.0 Samples?
(y)es/(n)o/(q)uit: y

Enter CUDA Samples Location
 [ default is /root ]: /home/sergiobranco/cuda_samples

Enter Toolkit Location
 [ default is /usr/local/cuda-8.0 ]: 

Error: cannot find Toolkit in /usr/local/cuda-8.0
Enter Toolkit Location
 [ default is /usr/local/cuda-8.0 ]: ??????????

問題は、ツールキットの場所を尋ねるのに私が知らないことです。 Enterキーを押してからサンプルをインストールしようとするとエラーが発生します。

Error: unsupported compiler: 6.3.0. Use --override to override this check.
Missing recommended library: libXmu.so

Error: cannot find Toolkit in /usr/local/cuda-8.0

===========
= Summary =
===========

Driver:   Not Selected
Toolkit:  Installation Failed. Using unsupported Compiler.
Samples:  Cannot find Toolkit in /usr/local/cuda-8.0


Logfile is /tmp/cuda_install_3212.log

--overrideパラメータを使用しましたが失敗しました。

その後、私はcudaが提供した「最初のプログラム」の少なくとも1つをコンパイルしようとしました。

#include <stdio.h>

__global__
void saxpy(int n, float a, float *x, float *y)
{
  int i = blockIdx.x*blockDim.x + threadIdx.x;
  if (i < n) y[i] = a*x[i] + y[i];
}

int main(void)
{
  int N = 1<<20;
  float *x, *y, *d_x, *d_y;
  x = (float*)malloc(N*sizeof(float));
  y = (float*)malloc(N*sizeof(float));

  cudaMalloc(&d_x, N*sizeof(float)); 
  cudaMalloc(&d_y, N*sizeof(float));

  for (int i = 0; i < N; i++) {
    x[i] = 1.0f;
    y[i] = 2.0f;
  }

  cudaMemcpy(d_x, x, N*sizeof(float), cudaMemcpyHostToDevice);
  cudaMemcpy(d_y, y, N*sizeof(float), cudaMemcpyHostToDevice);

  // Perform SAXPY on 1M elements
  saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);

  cudaMemcpy(y, d_y, N*sizeof(float), cudaMemcpyDeviceToHost);

  float maxError = 0.0f;
  for (int i = 0; i < N; i++)
    maxError = max(maxError, abs(y[i]-4.0f));
  printf("Max error: %f\n", maxError);

  cudaFree(d_x);
  cudaFree(d_y);
  free(x);
  free(y);
}

しかし、結果は次のようになります。

nvcc -ccbin clang-3.8 hello.c 
nvcc warning : The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated, and may be removed in a future release (Use -Wno-deprecated-gpu-targets to suppress warning).
hello.c:3:1: error: unknown type name '__global__'
__global__
^
hello.c:4:1: error: expected identifier or '('
void saxpy(int n, float a, float *x, float *y)
^
hello.c:14:15: warning: implicitly declaring library function 'malloc' with type 'void *(unsigned long)' [-Wimplicit-function-declaration]
  x = (float*)malloc(N*sizeof(float));
              ^
hello.c:14:15: note: include the header <stdlib.h> or explicitly provide a declaration for 'malloc'
hello.c:17:3: warning: implicit declaration of function 'cudaMalloc' is invalid in C99 [-Wimplicit-function-declaration]
  cudaMalloc(&d_x, N*sizeof(float)); 
  ^
hello.c:25:3: warning: implicit declaration of function 'cudaMemcpy' is invalid in C99 [-Wimplicit-function-declaration]
  cudaMemcpy(d_x, x, N*sizeof(float), cudaMemcpyHostToDevice);
  ^
hello.c:25:39: error: use of undeclared identifier 'cudaMemcpyHostToDevice'
  cudaMemcpy(d_x, x, N*sizeof(float), cudaMemcpyHostToDevice);
                                      ^
hello.c:26:39: error: use of undeclared identifier 'cudaMemcpyHostToDevice'
  cudaMemcpy(d_y, y, N*sizeof(float), cudaMemcpyHostToDevice);
                                      ^
hello.c:29:3: error: use of undeclared identifier 'saxpy'
  saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
  ^
hello.c:29:10: error: expected expression
  saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
         ^
hello.c:29:29: error: expected expression
  saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
                            ^
hello.c:29:31: warning: expression result unused [-Wunused-value]
  saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
                              ^
hello.c:29:34: warning: expression result unused [-Wunused-value]
  saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
                                 ^~~~
hello.c:29:40: warning: expression result unused [-Wunused-value]
  saxpy<<<(N+255)/256, 256>>>(N, 2.0f, d_x, d_y);
                                       ^~~
hello.c:31:39: error: use of undeclared identifier 'cudaMemcpyDeviceToHost'
  cudaMemcpy(y, d_y, N*sizeof(float), cudaMemcpyDeviceToHost);
                                      ^
hello.c:35:16: warning: implicit declaration of function 'max' is invalid in C99 [-Wimplicit-function-declaration]
    maxError = max(maxError, abs(y[i]-4.0f));
               ^
hello.c:35:30: warning: implicitly declaring library function 'abs' with type 'int (int)' [-Wimplicit-function-declaration]
    maxError = max(maxError, abs(y[i]-4.0f));
                             ^
hello.c:35:30: note: include the header <stdlib.h> or explicitly provide a declaration for 'abs'
hello.c:35:30: warning: using integer absolute value function 'abs' when argument is of floating point type [-Wabsolute-value]
    maxError = max(maxError, abs(y[i]-4.0f));
                             ^
hello.c:35:30: note: use function 'fabsf' instead
    maxError = max(maxError, abs(y[i]-4.0f));
                             ^~~
                             fabsf
hello.c:35:30: note: include the header <math.h> or explicitly provide a declaration for 'fabsf'
hello.c:38:3: warning: implicit declaration of function 'cudaFree' is invalid in C99 [-Wimplicit-function-declaration]
  cudaFree(d_x);
  ^
hello.c:40:3: warning: implicit declaration of function 'free' is invalid in C99 [-Wimplicit-function-declaration]
  free(x);
  ^
11 warnings and 8 errors generated.

答え1

まあ、ついにすべてをインストールでき、うまくいきました。 Debian 9 でこれを行う方法のチュートリアルをここに掲載します。

最初のステップ:

apt-get install nvidia-cuda-dev nvidia-cuda-toolkit  nvidia-driver 

上記のコマンドを実行するには、次の点を確認する必要があります。このリンクマザーボードに対してこれを正しく実行する方法をよりよく理解するには

その後、次の実行可能ファイルをダウンロードしました。クダ8.0

また、以下をインストールする必要がありました。

apt-get install libglu1-mesa libxi-dev libxmu-dev libglu1-mesa-dev

その後、ツールキットが機能するには、$ PATHにツールキットを含める必要がありました。

export PATH=$PATH:/usr/lib/nvidia-cuda-toolkit

その後、次のことを行う必要があります。

sh /home/username/Downloads/cuda_8.0.61_375.26_linux.run --tar mxvf
cp InstallUtils.pm /usr/lib/x86_64-linux-gnu/perl-base/
export $PERL5LIB

これでサンプルをインストールできます。

sh /home/username/Downloads/cuda_8.0.61_375.26_linux.run

ツールキットのパスを尋ねる場合は、次のように入力する必要があります。

/usr/lib/nvidia-cuda-toolkit

私の答えは次のとおりです。

Do you accept the previously read EULA?
accept/decline/quit: accept

You are attempting to install on an unsupported configuration. Do you wish to continue?
(y)es/(n)o [ default is no ]: y

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 375.26?
(y)es/(n)o/(q)uit: n

Install the CUDA 8.0 Toolkit?
(y)es/(n)o/(q)uit: n

Install the CUDA 8.0 Samples?
(y)es/(n)o/(q)uit: y

Enter CUDA Samples Location
 [ default is /root ]: /somewher

Enter Toolkit Location
 [ default is /usr/local/cuda-8.0 ]: /usr/lib/nvidia-cuda-toolkit

これで問題なくサンプルをインストールできます。その後、インストールされているフォルダに移動して実行できます。

nvcc -ccbin clang++-3.8 somefile.cu -o somename

それではそうします。 。 。

pycudaをインストールするには:

apt-get install build-essential python-dev python-setuptools libboost-python-dev libboost-thread-dev -y
apt-get install python-pycuda

関連情報