torque

CentOS 7:Python2.7.5が上書きされ、yumまたはpython2を使用できません。
torque

CentOS 7:Python2.7.5が上書きされ、yumまたはpython2を使用できません。

CentOS 7サーバーにTorque Queueシステムをインストールし、それをインストールするために設定コマンドを実行した後、デフォルトのpython2バージョン(2.7.5)を上書きしてpython2.7.18に置き換えました。 Python2.7.18は私のサーバーにインストールされていますが、環境モジュールシステムと統合できるように仮想環境に切り替えることを目的としています。まだ完了していませんが、Python2.7.18はパスに追加されておらず、Pythonに関連するコマンドもありませんでした。 Bashの履歴を見た後、yumコマンドが最後に動作...

Admin

ID以外のジョブ名でジョブをキャンセルできますか?
torque

ID以外のジョブ名でジョブをキャンセルできますか?

個々のジョブ番号をそれぞれ入力するのではなく、同じ名前の複数のジョブを削除できますか? qdel -u username別の作業が必要なので、このオプションを使用したくありません。 + 100の別々のタスクがあるので、より速いオプションがある場合は、各タスク番号を入力しないことをお勧めします! 私はこのオプションをオンラインで見つけました。 qdel wc_jobname しかし、エラーが返されます。 qdel:違法に形成されたジョブ識別子:wc_jobname ...

Admin

PBSジョブの実行が開始されてから「t」時間に生成されたファイル
torque

PBSジョブの実行が開始されてから「t」時間に生成されたファイル

私はPBSに仕事を提出しました02:00:00 hours。指定した時間にPBS作業ディレクトリにファイルを作成する必要があります。ティー (say 01:30:00 hours)ジョブの開始後、後続の再始動のためにジョブが正常に終了することを確認してください。たとえば、次のように echo "LABORT" > file1.txt 指定された時間に正確にファイルを生成したいので、リンク操作を介してファイルを生成するためにPBSに依存したくありません。これらのタスクの多くを実行するときにこれを達成するためのクリーンで自動化された方法はありますか?...

Admin

PrivateTmp = trueのサービスは、/ tmpディレクトリのUnixソケットにどのようにアクセスします(Apacheで実行されているPHPからTorqueジョブを送信するなど)。
torque

PrivateTmp = trueのサービスは、/ tmpディレクトリのUnixソケットにどのようにアクセスします(Apacheで実行されているPHPからTorqueジョブを送信するなど)。

私たちは、ユーザーが提出した科学的計算を実行するWebサーバーを持っています。計算の実行に時間がかかることがあるので、次のようにします。トルクリソースマネージャ(別名pbs_server)は、少数のコンピューティングノードにリソースを配布/予約します。 Torqueは/tmpディレクトリのUnixドメインソケットを使用して通信しますが、httpサーバー(およびここで作成されたプロセス)は物理ディレクトリにアクセスできないため、これらの/tmpプロセスではソケットが欠落しているように見え、エラーが発生します。 詳細: Webサーバーは、システム属性が...

Admin

TorqueでMOMノードあたりの正しいGPU数の自動更新を無効にする方法は?
torque

TorqueでMOMノードあたりの正しいGPU数の自動更新を無効にする方法は?

Toque 4.2.9のマイナーバージョンをインストールしました。 --enable-nvidia-gpus オプションでコンパイルされます。ドキュメントによると、このオプションを使用すると、ノードファイルは正しいGPU数で自動的に更新されます。オフにできますか? 利用可能なリソースを一時的に制限したいので、この質問をします。たぶんこれを達成する別の方法がありますか? ...

Admin

リモートサーバーでシェルジョブを実行し、ジョブを閉じずに端末を閉じます。
torque

リモートサーバーでシェルジョブを実行し、ジョブを閉じずに端末を閉じます。

リモートサーバーでタスクを実行するためにトルクを使用しています。現在迷惑な問題があります。 私が仕事を遂行するときに現在やっていることは次のとおりです。 Teamviewerを介して別のコンピュータにログイン このコンピュータからsshリモートサーバーにも同様です。ssh [email protected] ここでジョブスクリプトを実行すると、sh verycomplicatedrunscript.shユーザーに次の内容が表示されます。 I am now running job 1... I am now running job 2......

Admin

TORQUE qsubを使用して特定のノードを要求しますか?
torque

TORQUE qsubを使用して特定のノードを要求しますか?

TORQUE qsub がインストールされたクラスターがあります。ジョブを送信したいのですが、特定のノードセットの1つで実行されていることを確認したいと思います。 qsubジョブがセット外のノードではなく、要求されたセットのノードの1つに送信されるように、要求に可能なノードのリストを含めることは可能ですか? ...

Admin

GPU「cpuset」と同じ
torque

GPU「cpuset」と同じ

コンピュータクラスタを使用してノードを管理します。トルクそしてモアブ。 ユーザーはノードにジョブを送信し、必要なリソース量を要求できます。 #The following submits the job foo.sh to 1 node, requesting 8 cores, and 1 gpu qsub foo.sh -l nodes=1:ppn=8:gpus=1 ユーザーが要求したリソースよりも多くのリソースを取得できるため、有効にしました。hwlocライブラリ(cpusets)を使用してユーザーを制御します。 私が見つけたところによると、...

Admin

トルクでmpi速度を遅くする
torque

トルクでmpi速度を遅くする

私は30のノードと360のコアを持つクラスタでOpen MPIでTorqueを実行しています。私はmpirun -np N ~./myjob との壁時間がqsub -l nodes=1:ppn=N mpirun -np N ~./myjob 何度も異なることを発見しました。小規模な作業では、1.2秒から20秒に、2秒から37秒に増加する式に増えます。 大規模な作業では、これらの違いが重要になります。これを克服する方法は? ...

Admin