Nvidia GTXだけではLinuxが起動しません。

Nvidia GTXだけではLinuxが起動しません。

機械学習トレーニングサーバー(GPUを使用)として使用されるヘッドレスデスクトップコンピュータ(画面なし/キーボードなし)があります。別のコンピュータ(ノートブック)からSSH経由で接続します。

いつ:

  • Nvidia GTX 650をマザーボードに接続された唯一のグラフィックカードとして使用してコンピュータを起動しましたが、起動しないようで、SSH経由でコンピュータに接続できません。

  • Nvidia GTX 650 +既存のATI Radeonカード(MBに2つのPCI-expressスロットがある)を使用してコンピュータを起動し、起動し、SSH経由で接続できました。

注:Nvidiaのドライバがインストールされ(検出されて)apt-get install nvidia-315(2番目の場合)、Tensorflowがそれを正常に使用できるため、問題がドライバの欠落によるものではないことを意味します。

Ubuntu 16.04サーバーがNvidia GTX 650を唯一のグラフィックカードで起動できない問題は何ですか?

答え1

デュアルSIM構成でノートブックをインストールしましたが、ディスプレイ構成(X)がその構成を覚えている可能性があります。

あなたはできます:

  • ログファイル(システム、X)を確認し、ATIカードが接続されていない場合に何が起こるかを分析します。サーバーが起動し、いくつかのログが記録されますか?
  • xorg.confを更新または生成するのは少し面倒です。

答え2

奇妙なマザーボード+グラフィックカードの問題のようです(MB:M4A79XTD EVO)。私はまだこれを実際に理解していませんが、後で参照できるようにテストの説明は次のとおりです。

  • PCIEx16_1スロットにNvidia GTX 650 Tiのみ:起動できません!
    同じスロット内の既存のATIの取り外し:正常に起動済み同じスロット
    内の既存のRadeon HD 5770:正常に起動済み

  • スロットPCIEx16_2に別々に取り付けられたNvidia GTX 650 Ti:はい
    同じスロットに別々に取り付けられた古いATI:はい

  • スロットPCIEx16_1のNvidia GTX 650 Ti
    +スロットPCIEx16_2の既存のATI
    =>ブート良好

考えられる理由:

  • 私のPCIEx16_1スロットはx16モードで正しく動作しないようです。 2枚のグラフィックカードがある場合は、それぞれx8に強制することができます(それで動作します)。
    とにかく、古いグラフィックカードはおそらくx8を使用します。これは、PCIEx16_1スロットでも古いグラフィックカードと動作する理由を説明します。

解決策:

  • 新しいBIOSフラッシュ/アップデート(テストされていません)
  • ちょうどPCIEx16_2を使用し、PCIEx16_1を忘れてください。 (元のコンピュータケースにPCIEx16_1の位置が熱放出に役立つので、これを避けたいと思いました。)
  • PCIEx16_1でNvidiaを使用しますが、x8が動作するように強制するために、PCIEx16_2に古い(愚かな)グラフィックスカードを保持してください。

関連情報