私のサーバーが数分間応答しなくなる直前に関連性があるように見える次のログ行を見つけました。私はこれが何を意味し、どのような状況で起こるかをよりよく理解したいと思います。
Aug 25 18:23:32 myserver journal: Runtime journal is using 776.0M (max allowed 793.9M, trying to leave 1.1G free of 6.9G available → current limit 793.9M).
Aug 25 18:23:32 myserver journal: Runtime journal is using 776.0M (max allowed 793.9M, trying to leave 1.1G free of 6.9G available → current limit 793.9M).
Aug 25 18:23:32 myserver kernel: INFO: task in:imjournal:2125 blocked for more than 120 seconds.
Aug 25 18:23:32 myserver kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Aug 25 18:23:32 myserver kernel: in:imjournal D ffff88042bd2b8c8 0 2125 1 0x00000080
Aug 25 18:23:32 myserver kernel: ffff88041bfdfdb8 0000000000000082 ffff88042be0bec0 ffff88041bfdffd8
Aug 25 18:23:32 myserver kernel: ffff88041bfdffd8 ffff88041bfdffd8 ffff88042be0bec0 ffff88042be0bec0
Aug 25 18:23:32 myserver kernel: ffff88042bd2b8b8 ffff88042bd2b8c0 ffffffff00000000 ffff88042bd2b8c8
Aug 25 18:23:32 myserver kernel: Call Trace:
Aug 25 18:23:32 myserver kernel: [<ffffffff8168c7f9>] schedule+0x29/0x70
Aug 25 18:23:32 myserver kernel: [<ffffffff8168dfa5>] rwsem_down_write_failed+0x115/0x220
Aug 25 18:23:32 myserver kernel: [<ffffffff81327647>] call_rwsem_down_write_failed+0x17/0x30
Aug 25 18:23:32 myserver kernel: [<ffffffff812a84c0>] ? cap_mmap_addr+0x60/0x60
Aug 25 18:23:32 myserver kernel: [<ffffffff8168b9bd>] down_write+0x2d/0x30
Aug 25 18:23:32 myserver kernel: [<ffffffff811a07fc>] vm_mmap_pgoff+0x8c/0xe0
Aug 25 18:23:32 myserver kernel: [<ffffffff811b62d6>] SyS_mmap_pgoff+0x116/0x270
Aug 25 18:23:32 myserver kernel: [<ffffffff8102fb82>] SyS_mmap+0x22/0x30
Aug 25 18:23:32 myserver kernel: [<ffffffff81697809>] system_call_fastpath+0x16/0x1b
役立つ場合は、私のサーバーに関するいくつかの情報をお知らせします。
Centos 7.3 3.10.0-514.26.2.el7.x86_64 #1 SMP Tue Jul 4 15:04:05 UTC 2017 x86_64 x86_64 x86_64 GNU/Linux - クアッドコア(16GB RAMを含む) - 2TB
答え1
imjournalの使用がパフォーマンスに与える影響に関するこの記事をご覧ください。
http://www.rsyslog.com/doc/v8-stable/configuration/modules/imjournal.html
特にこの部分は:
警告:一部のシステムログバージョンには、ログが緊密なループ内で同じデータを無限に返す原因となるデータベース破損の問題があります。これにより、rsyslog 内で多数のメッセージが重複し、システム リソースが枯渇した場合にサービス拒否が発生する可能性があります。これは適切なスピードリミッタを使用してある程度軽減できますが、それでも古いデータには無限に繰り返される急増があります。デフォルトではレート制限が有効になっており、10分で20,000メッセージを処理できます。これはほとんどのユースケースには十分です。十分でない場合は、以下のパラメータを使用して許容される音量を調整してください。必要な場合にのみこのプラグインを使用することをお勧めします。
全体的にimuxsockの使用を検討する必要があると思います。