GNU findの「アクティブ化された機能」とはどういう意味ですか?

GNU findの「アクティブ化された機能」とはどういう意味ですか?

GNU findで使用すると、find --version次のような結果が得られます。

find (GNU findutils) 4.5.9     
[license text]
Features enabled: D_TYPE O_NOFOLLOW(enabled) LEAF_OPTIMISATION FTS(FTS_CWDFD) CBO(level=2)

これらの「特性」とはどういう意味ですか?にはO_NOFOLLOWセキュリティ対策が記載されており、man findリーフノードへのLEAF_OPTIMISATIONいくつかの呼び出しを保存する最適化が記載されています。しかし、lstatまたはに関する情報が見つかりません。FTSD_TYPECBO

答え1

これはKetanとDaniel Kullmanの答えと私の研究の完全な答えです。

ほとんどの「機能」はクエリの最適化です。findこれは通常、ファイルシステムで(ほぼ)任意に複雑なクエリを実行できるためです。


D_タイプ

この機能が存在するということは、このフィールドがLinuxでも採用されたBSD拡張であるD_TYPEことを意味しfind、andfriendsから返された構造にファイルタイプ(ディレクトリ、ファイル、パイプ、ソケット、文字/ブロックデバイスなど)を提供します。 )。最適化としてこれを使用すると、フィルタ式として使用されるときに呼び出しを減らしたり削除したりできます。d_typestruct direntreaddirfindlstat-type

readdird_type一部のファイルシステムでは常に埋められない可能性があるため、lstat依然として必要な場合があります。

公式文書の追加情報:https://www.gnu.org/software/findutils/manual/html_node/find_html/d_005ftype-Optimization.html

O_NOFOLLOW

オプションは(enabled)またはで表示されます(disabled)。存在して有効になっている場合、この機能は特定のfindTOCTTOUレース攻撃を防ぐセキュリティ対策を実装します。特に、findファイルの種類を確認した後、ディレクトリに入る前にディレクトリがシンボリックリンクに置き換えられた場合に発生する可能性があるディレクトリナビゲーションを実行するときにシンボリックリンクが通過するのを防ぎます。

このオプションを有効にすると、物理ディレクトリのみを開くことがディレクトリで使用され、そのディレクトリのファイルを開くために使用されますfindopen(..., O_NOFOLLOW)openat

LEAF_OPTIMISATION

この少しあいまいな最適化をfind使用すると、親ディレクトリのリンク数を使用して、親ディレクトリのどのサブディレクトリがディレクトリかを推測できます。これは、サブディレクトリが(linksを介して..)親ディレクトリのリンク数に影響を与えるためです。場合によっては、呼び出しをfind省略できますstat。ただし、ファイルシステムまたはオペレーティングシステムがそれを間違って表示すると、間違った結果が発生する可能性がst_nlinksありますfind(幸いなことにそうではありません)。

詳しくは公式ドキュメントをご覧ください。https://www.gnu.org/software/findutils/manual/html_node/find_html/Leaf-Optimization.html

FTS

有効にすると、このFTS機能をfind使用します。fts再帰を直接実装するのではなく、ファイル階層をナビゲートするためのAPIです。

利点が何であるかはわかりませんが、基本的にftsこれまでに見たFTSすべての基本バージョンのデフォルトです。find

追加情報:https://www.gnu.org/software/findutils/manual/html_node/find_html/fts.htmlhttp://man7.org/linux/man-pages/man3/fts.3.html

議会予算処

find(ダニエルクールだけが提案したソースコードを読んだ後)、「CBO」はクエリ最適化レベル(「コストベースのオプティマイザ」を表す)を意味することがわかりました。たとえば、これを行うと、次のようなfind -O9001 --version結果が得られます。

Features enabled: D_TYPE O_NOFOLLOW(enabled) LEAF_OPTIMISATION FTS() CBO(level=9001) 

-Oのオプションを見てくださいman find

-Olevel
  Enables query optimisation.   The find program reorders tests to speed up execution  while  preserving  the  overall
  effect; that is, predicates with side effects are not reordered relative to each other.  The optimisations performed
  at each optimisation level are as follows.

  0      Equivalent to optimisation level 1.

  1      This is the default optimisation level  and  corresponds  to  the  traditional  behaviour.   Expressions  are
         reordered  so that tests based only on the names of files (for example -name and -regex) are performed first.

  2      Any -type or -xtype tests are performed after any tests based only on the names  of  files,  but  before  any
         tests  that  require information from the inode.  On many modern versions of Unix, file types are returned by
         readdir() and so these predicates are faster to evaluate than predicates which need to stat the file first.

  3      At this optimisation level, the full cost-based query optimiser is enabled.  The order of tests  is  modified
         so  that  cheap  (i.e. fast) tests are performed first and more expensive ones are performed later, if neces-
         sary.  Within each cost band, predicates are evaluated earlier or later according to whether they are  likely
         to  succeed or not.  For -o, predicates which are likely to succeed are evaluated earlier, and for -a, predi-
         cates which are likely to fail are evaluated earlier.

  The cost-based optimiser has a fixed idea of how likely any given test is to succeed.  In some cases the probability
  takes  account of the specific nature of the test (for example, -type f is assumed to be more likely to succeed than
  -type c).  The cost-based optimiser is currently being evaluated.   If it does not actually improve the  performance
  of find, it will be removed again.  Conversely, optimisations that prove to be reliable, robust and effective may be
  enabled at lower optimisation levels over time.  However, the default behaviour (i.e. optimisation level 1) will not
  be  changed  in  the 4.3.x release series.  The findutils test suite runs all the tests on find at each optimisation
  level and ensures that the result is the same.

謎が解けました!オプションがランタイム値であることは少し奇妙です。通常、出力に--versionはコンパイル時オプションのみが反映されると予想されます。

答え2

情報はO_NOFOLLOW次のページにあります。infofind

9.2.1.1 O_NOFOLLOW

.....................

システムがO_NOFOLLOWフラグ(1)をサポートしている場合、open(2)' system call,find 'はディレクトリを変更するのが安全な場合に使用します。まず、ターゲットディレクトリを開き、find' changes working directory with thefchdir() 'システムコールを呼び出します。これはシンボリックリンクに従わないため、シンボリックリンクを使用した競合状態の攻撃を防ぎます。

...

ソースツリーを見ると、CBOファイルにのみ表示されますparser.c

 printf("CBO(level=%d) ", (int)(options.optimisation_level)); 

コストベースの最適化を提案します(私の推測では)。

D_TYPEソースツリーのさまざまな場所に表示され、ディレクトリエントリの種類に関連付けられているように見えます。

$ grep 'D_TYPE' */**

生産する:

find/parser.c:#if defined USE_STRUCT_DIRENT_D_TYPE && defined HAVE_STRUCT_DIRENT_D_TYPE
lib/savedirinfo.c:#if defined HAVE_STRUCT_DIRENT_D_TYPE && defined USE_STRUCT_DIRENT_D_TYPE

そしてより多くの項目。ソースコードを見つけることができますここ

答え3

findutilsソースツリーを見ると(http://git.savannah.gnu.org/cgit/findutils.git/tree/)、以下を発見した。

  • configure.ac: --enable-d_type-optimization, struct dirent.d_type の readdir() によって返されるファイル形式データを使用)
  • m4/withfts.m4: --without-fts fts() を使用する代わりに、以前のメカニズムを使用してファイルシステムを検索します。

CBOに関する情報が見つかりませんでした。ソースコードをダウンロードしてその用語を検索してください。

関連情報