perf-event

LinuxでFtraceを使用して予約遅延を取得するには?
perf-event

LinuxでFtraceを使用して予約遅延を取得するには?

ftraceはアクティブですが、.ftraceはアクティブではない組み込みLinux(kernel-5.10.24)システムを開発していますperf。 システムでトレースを確認した結果、次の情報が得られました。 # ls /sys/kernel/tracing/events/sched/ -l total 0 -rw-r--r-- 1 root root 0 Jan 1 1970 enable -rw-r--r-- 1 root root 0 Jan 1 1970 filte...

Admin

マイコンピュータでTLBに関する情報が見つからないか、TLBのハードウェアカウンタに関する情報を取得できません
perf-event

マイコンピュータでTLBに関する情報が見つからないか、TLBのハードウェアカウンタに関する情報を取得できません

私が使っているUbuntuのバージョンはUbuntu 18.04.6 LTS、カーネルバージョンは5.4.0-148 全般。私のプロセッサは第12世代Intel(R)コア(TM)i7-12700。 さまざまなページサイズ(1G、2MB、4KB)について、私のCPUのTLBエントリ数とプログラム実行中のdTLBミスの数を知りたいです。 cpuid -1コマンドはゼロであると伝えます。 L1 TLB/cache information: 2M/4M pages & L1 TLB (0x80000005/eax): instructio...

Admin

perfを使用してL3キャッシュミス率を見つけることができません。
perf-event

perfを使用してL3キャッシュミス率を見つけることができません。

perfを使用しようとすると、L3キャッシュミス率を取得しようとします。私が実行したコマンドは次のとおりです。 perf stat -e instructions,LLC-load-misses,LLC-loads ./program <arg1> <arg2> <arg3> これにより、次のような結果が表示されます。 667,922,092,353 instructions <not suppor...

Admin

パフォーマンス統計で指標を使用する方法
perf-event

パフォーマンス統計で指標を使用する方法

パフォーマンスリストにはいわゆる指標がたくさん表示されます。リストは次から始まります。 List of pre-defined events (to be used in -e): Metrics: BAClear_Cost [Average Branch Address Clear Cost (fraction of cycles)] C2_Pkg_Residency [C2 residency percent per package] C3_Core_Residency [C3 residency...

Admin

Archlinux、"kernel.perf_event_paranoid"は尊重されません。
perf-event

Archlinux、"kernel.perf_event_paranoid"は尊重されません。

CPUSからパフォーマンスカウンタ(PMC)を読み取るときは、次のことを行う必要がありますkernel.perf_event_paranoid(<=1カーネル文書) 以下のプログラムはPMCを読み、1カウンタを開けない場合は早く終了する必要があります。kernel.perf_event_paranoidつまり>1(後ろから確認syscall) 私はテストしました アーチLinuxLinux host1 5.17.9-arch1-1 #1 SMP PREEMPT Wed, 18 May 2022 17:30:11 +0000 x86_64 GNU...

Admin

「perf」を使用して壁時計時間に基づいてスタックサンプルを取得する方法
perf-event

「perf」を使用して壁時計時間に基づいてスタックサンプルを取得する方法

私はLinuxperf_eventsフレームワークを使用して、私たちのサーバーの1つにあるアプリケーションの問題を調査しようとしています。perfツールについて読んだことによると、スタックを収集するのは比較的簡単です。 単にN秒ごとにスタックを収集するイベントとして壁時間を使用できるかどうか疑問に思います。 現在使用しているコマンドは次のとおりです。 perf record -e cycles -T -o <dir>/samples.data -F 1 --call-graph dwarf -T -p <pid> 現在の理解によれば...

Admin

パフォーマンスロギング/レポートを使用した高周波パフォーマンスカウンタのサンプリング
perf-event

パフォーマンスロギング/レポートを使用した高周波パフォーマンスカウンタのサンプリング

このツールを使用して、高頻度(例:100〜200Hz)でパフォーマンスカウンタカウントを検索したいperf(例:https://github.com/RRZE-HPC/likwid/wiki/likwid-perfctr#the-timeline-modeしかし、より頻繁に)。これを行う方法はありますか?では、perf recordロギングとレポート結果を使用するときにどのフラグを使用する必要がありますかperf report? sleep 5これまで、実行中の5ms間隔でr6d70パフォーマンスカウンタを取得するために、次のことを試みましたsudo pe...

Admin

プロファイリングに使用されるPerfツールが過負荷でクラッシュする
perf-event

プロファイリングに使用されるPerfツールが過負荷でクラッシュする

ロード平均中に「perf Record -F 99 -g -p --sleep 300」を使用すると、問題なくperf.dataファイルを取得できます。ただし、負荷が高いと衝突が発生します。良い結果を得る唯一の方法は、頻度を30程度に下げることです。これはひどいことです。 理想的には、より良い結果を得るには、より速い速度が必要です(〜997サンプル/秒)。この問題を解決する方法はありますか? この問題は、Linuxカーネルスペースに関連している可能性があると思います。では、この問題を解決するにはどうすればよいですか? ...

Admin

`perf stat`オプション `--cpu`は実際に何を表示しますか?
perf-event

`perf stat`オプション `--cpu`は実際に何を表示しますか?

--cpuオプションを理解しようとしていますperf-stat。マニュアルページには次のように記載されています。 提供されたCPUのリストにのみ依存してください。複数のCPUをスペースなしでカンマ区切りリスト(0,1)として提供できます。 CPU範囲は-:0-2で指定します。スレッド固有モードでは、このオプションは無視されます。システム全体のモニタリングをイネーブルにするには、-a オプションがまだ必要です。デフォルトはすべてのCPUを使用することです。 このオプションを使用してプログラムを実行するCPUを制御できますか?と入力すると、--cpu...

Admin

ポリスチレン
perf-event

ポリスチレン

検索何Linuxで監視できますか?perf_events何が見つかりませんかKernel PMU event?つまり、次のようなperf version 3.13.11-ckt39プログラムイベントがあります。perf list branch-instructions OR cpu/branch-instructions/ [Kernel PMU event] 一般的に言えば、 Tracepoint event Software event Hardware event Hardware cache event Raw hardware eve...

Admin

perfは非常に大きなプロセスでは動作しません。
perf-event

perfは非常に大きなプロセスでは動作しません。

私は私のアプリケーションをプロファイリングするためによくperfを使用します。私は最近、それぞれ約750GのRAMを備えたいくつかの新しいコンピュータを購入しました。私はこれらのうちの1つで約400Gのメモリを使用するプロセスをプロファイリングしたいと思います。これは、1つを除くすべての新しいコンピュータでうまく機能します。 Ubuntuを実行しながら、すべて同じ方法でインストールされます。 自分でperfインストールしてコンパイルしてみました。apt-get子供から。 実行時には./perf top -p 14182時々結果が得られますが(長い間待って...

Admin

-fno-omit-frame-pointerでコンパイルしましたが、perf_eventのパフォーマンスレポートにスタックシンボルがありませんでした。
perf-event

-fno-omit-frame-pointerでコンパイルしましたが、perf_eventのパフォーマンスレポートにスタックシンボルがありませんでした。

そのトピックに関する多くのチュートリアルを読み、必要なことをすべて行ったにもかかわらず、シンボルを含むスタックトレースを提供するperf_eventsを取得することはまだ困難です。ローカルにインストールされたパフォーマンス(詳細については以下を参照)にどのような方法で障害が発生する可能性がありますか?とにかく、私がしたことは次のとおりです。 main.cppは、同じファイルで定義されたいくつかの関数を呼び出し、いくつかのメモリを割り当てて解放し、何かを印刷する単純なC ++プログラムです。 コンパイルコマンド: gcc -std=c++11 -lstd...

Admin

パフォーマンスリストにハードウェアキャッシュイベントが見つからないのはなぜですか?
perf-event

パフォーマンスリストにハードウェアキャッシュイベントが見つからないのはなぜですか?

新しく購入したノートブックでLinuxパフォーマンスを使用する際に問題があります。パフォーマンスリストに使用できるハードウェアキャッシュ効果はありません!まあ、私がサンプリングしたかった素晴らしい情報は文字通りすべてでした!私のパフォーマンスのリストは次のとおりです。 List of pre-defined events (to be used in -e): cpu-cycles OR cycles [Hardware event] instructions ...

Admin

パフォーマンスカーネルカウンタの動作に問題があります。
perf-event

パフォーマンスカーネルカウンタの動作に問題があります。

私は "perf_event_create_kernel_counter" APIを介してパフォーマンスカウンタを生成し、定期的にその値を読み取るカーネルモジュールを作成しました。 私のアプリケーションはカーネルバージョン4.0.9(および以前のリビジョン)では動作しますが、カーネルバージョン4.1(以降)では動作しません。 デフォルトでは、カーネルの将来のバージョンではソフトウェアカウンタ(例PERF_COUNT_SW_CPU_CYCLES:)のみを読み取ることができますが、ハードウェアカウンタ(例PERF_COUNT_HW_CACHE_MISSES:...

Admin