私を混乱させるオムキラー

私を混乱させるオムキラー

利用可能なメモリが十分な場合、カーネルがなぜこのoom Killerを発行するのか理解できません。

また、なぜそんなに多くのカーネルキャッシュページが割り当てられるのですか?読んだら記憶力は十分だと言いましたね。

ノーマル

DMA

一般アイドル回線

256MBのRAMを搭載した組み込みNANDフラッシュベースのデバイスです。

カーネル: 2.6.31

 myshellscript invoked oom-killer: gfp_mask=0xd0, order=2, oomkilladj=0 
 Backtrace: 
 [<c0106494>] (dump_backtrace+0x0/0x110) from [<c03641a0>] (dump_stack+0x18/0x1c) 
 r6:000000d0 r5:c9040c60 r4:00000002 r3:c0448690 
 [<c0364188>] (dump_stack+0x0/0x1c) from [<c015a314>] (oom_kill_process.clone.11+0x60/0x1b4) 
 [<c015a2b4>] (oom_kill_process.clone.11+0x0/0x1b4) from [<c015a738>] (__out_of_memory+0x154/0x178) 
 r8:c21e86e0 r7:001fb000 r6:00000002 r5:000000d0 r4:c9b6e000 
 [<c015a5e4>] (__out_of_memory+0x0/0x178) from [<c015a980>] (out_of_memory+0x68/0xa0) 
 [<c015a918>] (out_of_memory+0x0/0xa0) from [<c015d230>] (__alloc_pages_nodemask+0x42c/0x520) 
 r5:00000002 r4:000000d0 
 [<c015ce04>] (__alloc_pages_nodemask+0x0/0x520) from [<c015d388>] (__get_free_pages+0x18/0x44) 
 [<c015d370>] (__get_free_pages+0x0/0x44) from [<c0109418>] (get_pgd_slow+0x1c/0xe0) 
 [<c01093fc>] (get_pgd_slow+0x0/0xe0) from [<c0129ab0>] (mm_init.clone.43+0xb0/0xf0) 
 r7:c90858c0 r6:00000000 r5:c90858c0 r4:ce1a6680 
 [<c0129a00>] (mm_init.clone.43+0x0/0xf0) from [<c0129c40>] (mm_alloc+0x34/0x44) 
 r6:0009230c r5:c90858c0 r4:ce1a6680 r3:00000000 
 [<c0129c0c>] (mm_alloc+0x0/0x44) from [<c0180f70>] (bprm_mm_init+0x14/0x148) 
 r4:c5154000 r3:cd472564 
 [<c0180f5c>] (bprm_mm_init+0x0/0x148) from [<c01812d0>] (do_execve+0xa8/0x254) 
 [<c0181228>] (do_execve+0x0/0x254) from [<c0106000>] (sys_execve+0x3c/0x5c) 
 [<c0105fc4>] (sys_execve+0x0/0x5c) from [<c0102e80>] (ret_fast_syscall+0x0/0x2c) 
 r7:0000000b r6:0009230c r5:0009237c r4:000922fc 
 Mem-info: 
 DMA per-cpu: 
 CPU 0: hi: 18, btch: 3 usd: 0 
 Normal per-cpu: 
 CPU 0: hi: 42, btch: 7 usd: 0 
 Active_anon:28162 active_file:16 inactive_anon:18037 
 inactive_file:13 unevictable:0 dirty:0 writeback:0 unstable:0 
 free:9998 slab:2447 mapped:164 pagetables:701 bounce:0 
 DMA free:17128kB min:1560kB low:1948kB high:2340kB active_anon:51068kB inactive_anon:10320kB active_file:24kB inactive_file:0kB unevictable:0kB present:97536kB pages_scanned:0 all_unreclaimable? no 
 lowmem_reserve[]: 0 158 158 
 Normal free:22864kB min:2600kB low:3248kB high:3900kB active_anon:61580kB inactive_anon:61828kB active_file:40kB inactive_file:52kB unevictable:0kB present:162560kB pages_scanned:0 all_unreclaimable? no 
 lowmem_reserve[]: 0 0 0 
 DMA: 2358*4kB 912*8kB 25*16kB 0*32kB 0*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB 0*8192kB 0*16384kB = 17128kB 
 Normal: 4266*4kB 657*8kB 32*16kB 1*32kB 0*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB 0*8192kB 0*16384kB = 22864kB 
 26591 total pagecache pages 
 0 pages in swap cache 
 Swap cache stats: add 0, delete 0, find 0/0 
 Free swap = 0kB 
 Total swap = 0kB 
 65536 pages of RAM 
 10471 free pages 
 3967 reserved pages 
 2447 slab pages 
 892 shared page count 
 389 shared pages
 620 mapped shared page count
 177 mapped shared pages
 0 pages swap cached
 2481 dma reserved pages
 19892 total user pages
 20512 RSS sum by tasks
 20512 RSS sum by page stats
 164 user cache pages
 26427 kernel cache pages

答え1

編集:この答えは正しくありません。 oom-killerを呼び出す理由はまだ可能ですが、この場合は理由ではありません。


メモリの断片化によって引き起こされるようです。

提供された出力によると、最も高い順序の連続メモリブロックはnormalその領域の32kbブロックです。これは、32kbを超えるメモリブロックを割り当てようとすると失敗することを意味します。
通常、これは必ずしもoom-killerが呼び出されるという意味ではありませんが(そうでなければ、アプリケーションが大量のメモリを要求してOOMをトリガーする可能性があります)、これはメモリを割り当てようとするカーネルなので、より深刻です。この場合、新しいプロセスを開始して割り当てがトリガされ、カーネルがそのプロセスにメモリを割り当てようとするようです。

カーネルは自動的にメモリを圧縮(断片化)し、より大きな連続メモリブロックを解放しようとしますが、一部のページは移動できません。そして、システムが長く実行されるほど、これらの「移動できない」ページは分散されます。

したがって、基本的にできることはありません。実際に唯一のオプションは、移動できないページを解放するためにプロセスを終了することです。


上記の出力でメモリの断片化を示す内容は次のとおりです。

 DMA: 2358*4kB 912*8kB 25*16kB 0*32kB 0*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB 0*8192kB 0*16384kB = 17128kB 
 Normal: 4266*4kB 657*8kB 32*16kB 1*32kB 0*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB 0*8192kB 0*16384kB = 22864kB

これは、32*16kb32個の16kb連続空きメモリブロックがあることを意味します。

答え2

未知の組み込みプラットフォームで未知のアプリケーションを扱っています。もちろん、これら2つのことについてより多くの情報がある場合、abcの質問に答える可能性が高くなります。スクリプトが取得しようとしているメモリの量を正確に知ることも便利です。


私はパトリックが正しいと思います。プロセスを実行できる連続DMAが不十分です。これは、次の理由による可能性があります。

  1. 組み込みシステムにはカスタマイズされたページング実装があります。
  2. 組み込みシステムにはMMUがない可能性があります。
  3. このスクリプトは、DMAへの正確なアクセスのためにIOドライバを呼び出すことができます。
  4. このスクリプトには、連続メモリを必要とするサードパーティのプログラムが含まれている場合があります。

など...

DMAメモリの断片化を減らすと、OOM Killerはジャンプしないと思います。迅速にテストする最も簡単な方法は、内蔵デバイスを再起動し、OOM-killerがまだ呼び出されていることを確認することです。

今、あなたはデバイスをリセットせずにメモリを最適化するための軽量で組み込みのフレンドリーな方法を見つけるためにインターネットを探し続けます。

次のリンクに興味があるかもしれません。 http://bl0rg.krunch.be/oom-frag.html

関連情報