/proc/stat
開発者は一貫していないと報告されたCPU使用率について苦情を吐き出しました。
私の理解は/proc/stat
ティック数を数えることです。カーネル2.6以降、ティック数は100/sに固定されました。
これでCPU1を観察すると、/proc/stat
毎秒100ティック以上のティックが計算されるようです。これは不可能です。
このスクリプトは私が計算した方法を示しています。
cat /proc/uptime
b=`awk /cpu1/'{print $2+$3+$4+$5+$6+$7+$8+$9+$10+$11}' /proc/stat`
sleep 1
a=`awk /cpu1/'{print $2+$3+$4+$5+$6+$7+$8+$9+$10+$11}' /proc/stat`
cat /proc/uptime
expr $a - $b
出力例
32.80 19.06
33.86 19.51
CPU1 jiffies/s 137
のフィールドを合計し、/proc/stat
しばらく待ってからやり直してください。これにより、時には約140の合計差が発生します。かなり安定しています。たぶん、数カウントの上下に動くかもしれません。
カーネルの場合、CONFIG_HZ は 100 です。 250 または 1000 でコンパイルすると、変更は小さくなりますが、まだ残ります。
ユーザースペースと空きフィールドがほとんどの時間を占めるようです。一例では、私は102個のユーザースペースのジフを計算しました。したがって、ユーザー空間は常に占有されます。ただし、完全に予約されたCPUで実行されるアイドルティックは33です。
Linux kernel 4.14.34
RTプリエンプションパッチを実行するデュアルコアARMv7プロセッサがあります。同時にリアルタイム制御アプリケーションを実行しています。
私の問題は、/proc/stat
数値が一致しないことです。しかし、これを理解するために、なぜ/proc/stat
100を超えて数えることができるのか知りたいのです。
編集:スクリプトにcat /proc/uptimeを追加しました。
答え1
使用するスクリプトが主な問題です。コンテキスト遷移は待ち時間に関して非常に高価である。
sleep 1
スクリプトをスリープ状態にしておきます。タイマーが完了すると、プロセスは再び実行可能になり、CPUの他のコアに再割り当てすることができます(移行)。したがって、基本的に/proc/stat
投稿で述べたように、正確に1000msごとにポーリングするわけではありません。
ところで、これはRTコアを評価する良い方法ではありません。
sysjitter
Solarflareの例を試してください。システムジッタオープンロードこれにより、カーネルがどのように機能するかをよりよく知ることができます。
主な概念は、コアのタイムスタンプカウンタ(TSC)レジスタを集計し、次の2つの値を比較してコアが実行されるたびに何が起こったかを確認するコア(コアあたり1つの実行スレッド)に無限ループを固定することです。 。実行中のプロセスのプリエンプション差(100hzと仮定)
これにより、サーバーのシステムジッタをよりよく理解し、それをさらに調整することを決定できます。
また、ユースケースでこれらの改善が必要な場合は、CPU分離、アプリケーション専用コア、およびダイナミックティッキングカーネル構成も考慮する必要があります。
awk
編集:すべての要件に対して、次の小さなスクリプトを使用することをお勧めします。
#!/usr/bin/awk
BEGIN {
sum1=0;
sum2=0;
result=0;
file="/proc/stat";
while (( getline < file ) > 0 ) {
if ($1=="cpu1"){ sum1=$2+$3+$4+$5+$6+$7+$8+$9+$10+$11 };
}
close(file) ;
print "firt time " sum1;
system("sleep 10");
while (( getline < file ) > 0 ) {
if ($1=="cpu1") { sum2=$2+$3+$4+$5+$6+$7+$8+$9+$10+$11 }
}
close (file)
print "secont time " sum2;
result=sum2-sum1;
print "sum is " result/10;
}
サンプリング時間は10秒以上で、結果を10で割って1秒スライスの平均時間を求めます。