大きなテキストファイルから行を抽出する

Question 1

コメントを介して+7番目の列または-。入力ファイルはタブで区切られます。おそらくこれのための最も自然なツールは、次の名前+のファイルに行を保存し、plus次のファイルに減算行を保存することです。minusawk

awk -F'\t' '$7=="+"{print >"plus"} $7=="-"{print>"minus"}' file

仕組み：

Answer

コメントを介して+7番目の列または-。入力ファイルはタブで区切られます。おそらくこれのための最も自然なツールは、次の名前+のファイルに行を保存し、plus次のファイルに減算行を保存することです。minusawk

awk -F'\t' '$7=="+"{print >"plus"} $7=="-"{print>"minus"}' file

仕組み：

Question 2

sed -ne '/^[^+-]*+/w plus.file' -e //d -e '/^[^+-]-/w minus.file' <infile

7番目のタブで区切られたセクションに対して、次の操作を行います。

sed -ne 'h;s/\([^\t]*\t\)\{6\}[^\t+-]*//
            /^-/{g;w minus.file' -e 'b
         }; /^+/{g;w plus.file'  -e \}

ただし、上記のエスケープ文字の<tab>代わりにリテラル文字を使用する必要があります。\t

Answer

sed -ne '/^[^+-]*+/w plus.file' -e //d -e '/^[^+-]-/w minus.file' <infile

7番目のタブで区切られたセクションに対して、次の操作を行います。

sed -ne 'h;s/\([^\t]*\t\)\{6\}[^\t+-]*//
            /^-/{g;w minus.file' -e 'b
         }; /^+/{g;w plus.file'  -e \}

ただし、上記のエスケープ文字の<tab>代わりにリテラル文字を使用する必要があります。\t

関連情報