クラスタにQoS制限を設定しようとしています。特に誰もが特定のパーティションにジョブを送信できないようにしたいと思います。だから私はパーティションでCPU制限を有効にしましたが、期待どおりに機能しましたが、Slurmを再起動しても制限が保持されないことがわかりました。これは正常ですか?
$/opt/slurm/bin/scontrol update PartitionName=login-queue QoS=login-node
$scontrol show partition login-queue
PartitionName=login-queue
AllowGroups=ALL AllowAccounts=ALL AllowQos=ALL
AllocNodes=ALL Default=NO QoS=login-node
DefaultTime=NONE DisableRootJobs=NO ExclusiveUser=NO GraceTime=0 Hidden=NO
MaxNodes=1 MaxTime=UNLIMITED MinNodes=0 LLN=NO MaxCPUsPerNode=UNLIMITED MaxCPUsPerSocket=UNLIMITED
NodeSets=login-queue_nodes
Nodes=login-queue-st-t3medium-1
PriorityJobFactor=1 PriorityTier=1 RootOnly=NO ReqResv=NO OverSubscribe=NO
OverTimeLimit=NONE PreemptMode=OFF
State=UP TotalCPUs=2 TotalNodes=1 SelectTypeParameters=NONE
JobDefaults=(null)
DefMemPerNode=UNLIMITED MaxMemPerNode=UNLIMITED
TRES=cpu=2,mem=3891M,node=1,billing=2
ResumeTimeout=GLOBAL SuspendTimeout=GLOBAL SuspendTime=GLOBAL PowerDownOnIdle=NO
$systemctl restart slurmctld.service
$scontrol show partition login-queue
PartitionName=login-queue
AllowGroups=ALL AllowAccounts=ALL AllowQos=ALL
AllocNodes=ALL Default=NO QoS=N/A
DefaultTime=NONE DisableRootJobs=NO ExclusiveUser=NO GraceTime=0 Hidden=NO
MaxNodes=1 MaxTime=UNLIMITED MinNodes=0 LLN=NO MaxCPUsPerNode=UNLIMITED MaxCPUsPerSocket=UNLIMITED
NodeSets=login-queue_nodes
Nodes=login-queue-st-t3medium-1
PriorityJobFactor=1 PriorityTier=1 RootOnly=NO ReqResv=NO OverSubscribe=NO
OverTimeLimit=NONE PreemptMode=OFF
State=UP TotalCPUs=2 TotalNodes=1 SelectTypeParameters=NONE
JobDefaults=(null)
DefMemPerNode=UNLIMITED MaxMemPerNode=UNLIMITED
TRES=cpu=2,mem=3891M,node=1,billing=2
QoS=N/A
再起動後
持続するように設定する方法はありますか?必要な他のログを共有します。