機械学習トレーニングサーバー(GPUを使用)として使用されるヘッドレスデスクトップコンピュータ(画面なし/キーボードなし)があります。別のコンピュータ(ノートブック)からSSH経由で接続します。
いつ:
Nvidia GTX 650をマザーボードに接続された唯一のグラフィックカードとして使用してコンピュータを起動しましたが、起動しないようで、SSH経由でコンピュータに接続できません。
Nvidia GTX 650 +既存のATI Radeonカード(MBに2つのPCI-expressスロットがある)を使用してコンピュータを起動し、起動し、SSH経由で接続できました。
注:Nvidiaのドライバがインストールされ(検出されて)apt-get install nvidia-315
(2番目の場合)、Tensorflowがそれを正常に使用できるため、問題がドライバの欠落によるものではないことを意味します。
Ubuntu 16.04サーバーがNvidia GTX 650を唯一のグラフィックカードで起動できない問題は何ですか?
答え1
デュアルSIM構成でノートブックをインストールしましたが、ディスプレイ構成(X)がその構成を覚えている可能性があります。
あなたはできます:
- ログファイル(システム、X)を確認し、ATIカードが接続されていない場合に何が起こるかを分析します。サーバーが起動し、いくつかのログが記録されますか?
- xorg.confを更新または生成するのは少し面倒です。
答え2
奇妙なマザーボード+グラフィックカードの問題のようです(MB:M4A79XTD EVO)。私はまだこれを実際に理解していませんが、後で参照できるようにテストの説明は次のとおりです。
PCIEx16_1スロットにNvidia GTX 650 Tiのみ:起動できません!
同じスロット内の既存のATIの取り外し:正常に起動済み同じスロット
内の既存のRadeon HD 5770:正常に起動済みスロットPCIEx16_2に別々に取り付けられたNvidia GTX 650 Ti:はい
同じスロットに別々に取り付けられた古いATI:はいスロットPCIEx16_1のNvidia GTX 650 Ti
+スロットPCIEx16_2の既存のATI
=>ブート良好
考えられる理由:
- 私のPCIEx16_1スロットはx16モードで正しく動作しないようです。 2枚のグラフィックカードがある場合は、それぞれx8に強制することができます(それで動作します)。
とにかく、古いグラフィックカードはおそらくx8を使用します。これは、PCIEx16_1スロットでも古いグラフィックカードと動作する理由を説明します。
解決策:
- 新しいBIOSフラッシュ/アップデート(テストされていません)
- ちょうどPCIEx16_2を使用し、PCIEx16_1を忘れてください。 (元のコンピュータケースにPCIEx16_1の位置が熱放出に役立つので、これを避けたいと思いました。)
- PCIEx16_1でNvidiaを使用しますが、x8が動作するように強制するために、PCIEx16_2に古い(愚かな)グラフィックスカードを保持してください。