コマンドラインに優しいフルテキストインデックス付け?

コマンドラインに優しいフルテキストインデックス付け?

コマンドラインからクエリでき、理想的にはGUIをまったく使用する必要がないフルテキストインデックスエンジンのようなものはありますか?

私は特に電子ブックや論文のインデックスを作成することに興味があるので、ここにはpdf、epub、いくつかのdjvuが混在しています。 (公開)Office文書があればいいのですが、私のリストでははるかに低いです。

答え1

LuceneやSphinxを見ましたか?まず、索引付けしたい文書を解析する必要がありますが、完了したら、cliでそのうちの1つを検索できます。

Luceneの場合、このタスクに関するいくつかの情報があります。書くことができる

Sphinx、少しあいまいですが、いくつかの文書もあります書くことができる。 xmlpipe2データソースを使用すると、必要な構造化XMLデータをスフィンクスに渡すことができます。

LuceneはJavaを使用しますが、SphinxはC ++で構築されており、外部依存関係は必要ありません。

どちらにしても欲しいものを達成するには少し作業が必要ですが、完全に実行可能な解決策のようです。

答え2

確認する西部映画。コマンドラインインターフェイスがあり、複数の形式をインデックス化できます。

答え3

記録GUIなしで構築でき、コマンドラインから文書タイプを取得できます。

それを使うシャピアンフード。

答え4

Trackerはコマンドラインから呼び出すことができ、gtk +はプロジェクトのハード依存関係ではありません(ただし、パッケージのハード依存関係になる可能性があります)。

関連情報