私のサーバー負荷が高い理由を見つける方法はありますか？

Question 1

使用されているスワップの量を見ると、スワップが原因である可能性があることがわかります。 vmstatの出力は問題シナリオでこれをよりよく示しています。

vmstat 1 30

しかし、topやvmstatは事後問題の診断には適していません。

私の一般的なアドバイスは、このパッケージをインストールすることですsysstat。これにより、システム指標を定期的に保存してからその情報を検索できますsar。 Sysstatはさまざまな詳細で構成できますが、デフォルト設定ではCPU使用率、システム負荷、ページング、および交換の予備的な概要を提供します。

yum install sysstat

sar 
sar -q
sar -B
sar -W

しかし、これがうまくいかない場合は、さらに詳しく調べることをお勧めします。プロセスキュー（負荷平均）に加えて、一般的なパフォーマンス指標を使用してすぐに確認できない作業が進行中である可能性があります。 1つの可能性は、CPUがあまりにも多くの割り込み要求を処理し、システムに残っている使用可能な処理時間中にプロセスがキューに入れられることです。

もしそうなら、/proc/interruptsでいくつかの手がかりを見つけることができます。

cat /proc/interrupts

ネットワークアダプタやローカルタイマーが異常に多数の割り込みを表示しているのでしょうか？

これは、慣れ親しんで次のperf問題が発生するのを待つことに起因する可能性があります。問題が発生したらすぐにロギングを開始するか、平均負荷が高いときにトリガーされるスクリプトを使用してプロセスを自動化します。

perf record -a

perf report

Perfはシステム操作の非常に詳細なビューを提供しますが、大量のデータを収集してかなりのオーバーヘッドを引き起こすため、継続的に実行するのは非現実的です。

CentOS 6.3の場合、ローカルタイマーに関連するカーネルソースコードのバグを修正するCentOS 6.4にアップグレードした後、奇妙に高い負荷平均が消えることがあります。ただし、ハードウェアベンダーから提供された特定のドライバによって問題が発生する可能性があります。

Answer

使用されているスワップの量を見ると、スワップが原因である可能性があることがわかります。 vmstatの出力は問題シナリオでこれをよりよく示しています。

vmstat 1 30

しかし、topやvmstatは事後問題の診断には適していません。

私の一般的なアドバイスは、このパッケージをインストールすることですsysstat。これにより、システム指標を定期的に保存してからその情報を検索できますsar。 Sysstatはさまざまな詳細で構成できますが、デフォルト設定ではCPU使用率、システム負荷、ページング、および交換の予備的な概要を提供します。

yum install sysstat

sar 
sar -q
sar -B
sar -W

しかし、これがうまくいかない場合は、さらに詳しく調べることをお勧めします。プロセスキュー（負荷平均）に加えて、一般的なパフォーマンス指標を使用してすぐに確認できない作業が進行中である可能性があります。 1つの可能性は、CPUがあまりにも多くの割り込み要求を処理し、システムに残っている使用可能な処理時間中にプロセスがキューに入れられることです。

もしそうなら、/proc/interruptsでいくつかの手がかりを見つけることができます。

cat /proc/interrupts

ネットワークアダプタやローカルタイマーが異常に多数の割り込みを表示しているのでしょうか？

これは、慣れ親しんで次のperf問題が発生するのを待つことに起因する可能性があります。問題が発生したらすぐにロギングを開始するか、平均負荷が高いときにトリガーされるスクリプトを使用してプロセスを自動化します。

perf record -a

perf report

Perfはシステム操作の非常に詳細なビューを提供しますが、大量のデータを収集してかなりのオーバーヘッドを引き起こすため、継続的に実行するのは非現実的です。

CentOS 6.3の場合、ローカルタイマーに関連するカーネルソースコードのバグを修正するCentOS 6.4にアップグレードした後、奇妙に高い負荷平均が消えることがあります。ただし、ハードウェアベンダーから提供された特定のドライバによって問題が発生する可能性があります。

Question 2

ロギングによる一部のシステム監視がないと、事後に高いシステム負荷の原因を特定することは困難です。

パフォーマンスの低下の一般的な原因は、RAMの枯渇によるシステムスラッシングです。

ほとんどのUnixシステムでは、スラッシングは高い負荷を発生させませんが、Linuxはこの指標でI / Oを待つプロセスを考慮しているので、ここでもそうです。

Answer

ロギングによる一部のシステム監視がないと、事後に高いシステム負荷の原因を特定することは困難です。

パフォーマンスの低下の一般的な原因は、RAMの枯渇によるシステムスラッシングです。

ほとんどのUnixシステムでは、スラッシングは高い負荷を発生させませんが、Linuxはこの指標でI / Oを待つプロセスを考慮しているので、ここでもそうです。

Question 3

どのプロセスに問題があるかを確認するには、次の手順を実行します。

実行top -H(-H表示スレッドの有効化)

キーボードショートカットはバージョンによって異なります。

以前のバージョン（3.3以前？）の場合：

Shift+を押してoソートオプションを呼び出します。
次に、wプロセスの状態でソートします。
その後、Enterホームページに戻ります。
次にShift+をR使用してソートを逆にします。

最新のトップ(3.3?以上)を使用:

fフィールドオプションを読み込むには押します。
矢印キーを使ってに行き、S = Process Statusを押しますs。ホームページに戻る
にはタップします。 +を押すとソートが逆になります。q
ShiftR

次に、その列SのDプロセスを見つけますR（今すぐ上にある必要があります）。これはシステム負荷に影響を与えるプロセスです。

プロセスが表示されたら、D「邪魔されずにスリープ」を意味します。通常、これはプロセスがI / O（ディスク、ネットワークなど）を待っているときに発生します。
プロセスにマークが表示された場合は、R通常の計算を実行していることを意味します。

これらのプロセスが実行する操作の詳細については、次の手順を実行してください。

古いトップと一緒に：

f次に、yそのフィールドを有効にするにはタップしますWCHAN。

新しいトップと一緒に：

fフィールドオプションを読み込むには押します。
矢印キーを使ってに移動し、WCHAN = Sleeping in Functionを押してd有効にします。
その後、qホームページに戻ります。

システムに必要なカーネルオプションがあり、wchanファイルがシステムに存在する場合（どこか、名前が何なのか忘れてしまいました）、このWCHANフィールドは現在のプロセスで実行されているカーネル機能を表示する必要があります（フィールドにすべての項目に対してaまたは-aのみが表示されている場合はサポート?されません）。
ここでGoogleを検索しても大丈夫でしょう。

wchanのサポートがなければ、いつでもstraceプロセスを見て、彼らがやっていることを確認できますが、これは難しい方法です。

Answer

どのプロセスに問題があるかを確認するには、次の手順を実行します。

実行top -H(-H表示スレッドの有効化)

キーボードショートカットはバージョンによって異なります。

以前のバージョン（3.3以前？）の場合：

Shift+を押してoソートオプションを呼び出します。
次に、wプロセスの状態でソートします。
その後、Enterホームページに戻ります。
次にShift+をR使用してソートを逆にします。

最新のトップ(3.3?以上)を使用:

fフィールドオプションを読み込むには押します。
矢印キーを使ってに行き、S = Process Statusを押しますs。ホームページに戻る
にはタップします。 +を押すとソートが逆になります。q
ShiftR

次に、その列SのDプロセスを見つけますR（今すぐ上にある必要があります）。これはシステム負荷に影響を与えるプロセスです。

プロセスが表示されたら、D「邪魔されずにスリープ」を意味します。通常、これはプロセスがI / O（ディスク、ネットワークなど）を待っているときに発生します。
プロセスにマークが表示された場合は、R通常の計算を実行していることを意味します。

これらのプロセスが実行する操作の詳細については、次の手順を実行してください。

古いトップと一緒に：

f次に、yそのフィールドを有効にするにはタップしますWCHAN。

新しいトップと一緒に：

fフィールドオプションを読み込むには押します。
矢印キーを使ってに移動し、WCHAN = Sleeping in Functionを押してd有効にします。
その後、qホームページに戻ります。

システムに必要なカーネルオプションがあり、wchanファイルがシステムに存在する場合（どこか、名前が何なのか忘れてしまいました）、このWCHANフィールドは現在のプロセスで実行されているカーネル機能を表示する必要があります（フィールドにすべての項目に対してaまたは-aのみが表示されている場合はサポート?されません）。
ここでGoogleを検索しても大丈夫でしょう。

wchanのサポートがなければ、いつでもstraceプロセスを見て、彼らがやっていることを確認できますが、これは難しい方法です。

私のサーバー負荷が高い理由を見つける方法はありますか？

答え1

答え2

答え3

以前のバージョン（3.3以前？）の場合：

最新のトップ(3.3?以上)を使用:

古いトップと一緒に：

新しいトップと一緒に：

関連情報