エディタ:Ubuntu(mate)20.04、intel_pstateドライバ。私のコンピュータは、Intel Core i7 i7-8565Uを搭載したRazer Blade Stealth Ultrabook(2019年初め)です。
TLPをACモードに設定しても、バッテリ電源のみで実行すると異常な動作(重大な速度低下)が発生します。 CPUfrequtilsをパフォーマンスモード(特にマルチスレッド)に設定すると、問題がさらに悪化します!
シングルスレッドのケース(つまり、メインスレッドのみ)から始めましょう。 Webカメラのファイルやビデオフレームに一連のOPENCVフィルタ(ガウシアンブラーなど)を実行しています。すべてのフレームをメモリに最初にロードしても構いません(つまり、ディスクやデバイスI / Oの問題ではありません)。シングルサイクル(1フレーム)の処理時間は次のとおりです。これは複雑なコードではありません。デフォルトでは、次の操作を行います。
Filter filters[400]
while( cap.read(frame) )
{
for( int i=0; i<400; ++i )
{
filters[i].dofilter(frame);
}
}
ここで、フィルタ[i].dofilterはcv :: GaussianBlur、resize()などを呼び出し、ターゲットcv :: Matを事前割り当てします(追加割り当ては実行しません)。
これはCPUのみを使用します(つまり、OPENCV透明openCLなどは使用しません)。
シングルスレッド
AC + powersave: 71 msec (variance 70.5-71.5)
AC + performance: 67 msec (variance 66.5-67.5)
BAT + powersave: 95 msec (variance 84.0-115.0) *1
BAT + performance: 104 msec (variance 76.0-202.0) *2
1* Note: spikes to 110+ about every 5 sec
2* Note: most ~96, with few spikes low to 80s and high to 120s
方法:60秒間、各条件を10回実行(10回実行あたり〜600フレーム= 6000)、ランダムに注文します(熱、バッテリ電圧などが混ざらないように)。
私は使う同じ入力フレーム各ループ(つまり、毎回処理される画像の内容が異なるためではありません)。実際、すべての時間ステップでまったく同じ入力を処理します。 ACアダプターを抜き差ししたり、cpufrequtilsを使ってスリープ/パフォーマンスを設定したりすると、フレームあたりの処理時間が変わることをすぐに確認できます。
私は完全に圧倒されました。
私はIntel Core i7 i7-8565Uと一緒にRazer Blade Stealthウルトラブックを使用しています。 Ubuntu(mate)20.04、intel_pstateドライバ。
だから、3つの具体的な質問があります。
1)正確に何が起こりましたか?
2)TLP(カーネルパラメータ?)をACにあるかのように強制的に設定するにはどうすればよいですか? )?そしてそれはまだ終わっていません!
3)バッテリー電源に秘密/異常な設定がありますか?特にマルチスレッドに関連していますか?問題は並列性が非常に高いことです。デフォルトでは、並列に実行できる8つの独立したフィルタチェーンがあります。通常私はそうします。 ACでこれを行うと、次のことが起こります。
マルチスレッド(8スレッド)
AC + powersave: 28.6 msec (variance 26.8-31.1)
AC + performance: 28.8 msec (variance 26.6-31.2)
BAT + powersave: 39 msec (variance 36.0-64.0) *3
BAT + performance: 176 msec (variance 39.0-202.0) *4
3* Note: this is very tame compared to if I run with webcam -- then it spikes heavily between 40 and 90
4* Note: will update at 40 msec for a few frames, then go to 180 msec for a long time, then burst at 40 for a few.
ソフトウェアはスレッドプールを介してマルチスレッドを実装します。ロックをチェックし、極端なマルチスレッド状態でもロックを待つのに時間を費やしていませんでした(最初にそれが問題だと思ったので、実際に最も時間を費やしました...)。 2〜8個のスレッドを使用しても同様の結果が得られました。バッテリーを使用すると、スレッド数が多いほどスピードが遅くなります(特にパフォーマンスモードでは)、ACを使用するとスレッド数が多いほどスピードが速くなります。
編集:TLPを無効にしても問題が発生します。まだ既存のACPI周波数レギュレータに切り替えていません。 (効果があると思いますか?)
編集2:シングルスレッドモードでは、htopは固定CPUコアのみを表示します(つまり、ベクトル化してより多くのコアを使用するためにopenmpや他のものを使用しません)。
答え1
問題は intel_pstate ドライバです。
ブートカーネルパラメータを介して元のACPIドライバに切り替えました。具体的には、/etc/default/grubでDEFAULTブートラインを次のように変更しました。
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash intel_pstate=disable acpi=force"
(update-grub
覚えた後)。
今何の変更もなく(つまり、デフォルトの「ondemand」):
マルチスレッド(8スレッド)
BAT + ondemand: 38.5 (37.5 ~ 40.0)
BAT + performance: 31.8 (30.1 ~ 35.0) *1
1 *数秒ごとに最大35までの非常に小さなスパイクが表示されますが、これには理由があります...
皮肉なことに、一般的な作業(ブラウジング、EMACS、Wi-Fiなど)のうち、消費電力は実際にはintelli_pstate(平均590mA対660mA)を使用するよりもACPIドライバを使用する方が良いです。幸せ(しかし心配)副作用。
編集: 1つの欠点は、intel_pstateドライバを使用しない場合、サスペンド(スリープモード)がより多くの電力を消費するように見えることです。 12時間ごとに10%程度...
答え2
これは私のカーネルのmake
「ダウンオンリー」ベンチマークです(つまり、make
何もしないとき - 数秒)。
makeのオプションを認識するのに時間がかかり、-j
Turbo-BoostおよびSMT / Hyperthreading設定を変更するために再起動する必要はありません/sys
。 。
私のTDPは28Wです。ラップトップではなくi5-8259Uです。通常(今のように)3.5W-5Wを消費します。以下は、ワットの物理的測定に焦点を当てて記録した結果の一部です。
time make -j10 -O O=../make-out/
TB+HT,mitigations=off
-j8: 4.8s 57W (max.)
-j4: 12.3s 20W (-35W)
no-j: 21.7s 19W (max.)
-j4II: 6.4s 45W
行に変更するとより正確になります。 57Wにはファンが含まれているようです。これら2つの-j4
結果は、総エネルギー(Ws = Joules)がある程度一定に保たれることを示しています。
TB no, HT yes
-j10: 7.7s 22W
私が書いた最後のテストは次のとおりです。
TB 25-35-1sec "tau", HT yes, mitig.=off
-j10: 5.2s 40W
このTurbo-Boost設定はBIOSで提供され、「最大57W」を制限するのに役立ちます。最初の実行から。
しかし、sysfsに75(パーセント)を書いた後、intel_pstate/max_perf_pct
より良いブースト方法を見つけましたが、3.8GHzではなく3.0GHzまでしか可能ではありません。
35W(最大44W)では5.5秒、約50Wでは4.8秒かかります。ブーストなしで25Wで6.7秒。
よりアクティブなコアとより高いCPU周波数を介して巨大な時間の違いそしてワット。 GPU(あなたの場合?)とファンを追加することもできます。
バッテリーが非常に早く消耗する以外に、バッテリーに過電流の問題があるかどうかは今はわかりません。しかし、私の測定によると、違いはかなり大きくなり、通常は温度などのいくつかの制限があります。
しかし、剃刀刃ウルトラブック- バッテリー不良!