複数のファイルからテキスト行を抽出して1つのファイルとして印刷する

Question 1

まず、コマンドラインでいくつかの便利なシェル変数を定義します。

$ d='[0-9]'
$ pre='TrkNbr_1083n1282_L1n2_PrelimPops'
$ main="$d${d}SubSampPops_Rep$d$d$d"
$ post='GenDivRslts'
$ filename="${pre}_${main}_${post}"

GNUの使用awk:

$ find . -type f -name "$filename"      |
  sort -t_ -nk5.1,5.2 -nk6.4,6.6        |
  xargs -r awk 'FNR==2{print;nextfile}' \
> new_text_file;

GNUの使用sed:

$ find . -type f -name "$filename" |
  sort -t_ -nk5.1,5.2 -nk6.4,6.6   |
  xargs -r sed -se '2!d'           \
> new_text_file;

そしてperl：

$ find . -type f -name "$filename"                |
  sort -t_ -nk5.1,5.2 -nk6.4,6.6                  |
  xargs -r perl -ne 'print,close ARGV if $. == 2' \
> new_text_file;

そしてhead/tail：

$ find . -type f -name "$filename" |
  sort -t_ -nk5.1,5.2 -nk6.4,6.6   |
  xargs -r \
   sh -c '
    for f
    do
     head -n 2 "$f" | tail -n 1
    done
   ' x > new_text_file;

Answer

まず、コマンドラインでいくつかの便利なシェル変数を定義します。

$ d='[0-9]'
$ pre='TrkNbr_1083n1282_L1n2_PrelimPops'
$ main="$d${d}SubSampPops_Rep$d$d$d"
$ post='GenDivRslts'
$ filename="${pre}_${main}_${post}"

GNUの使用awk:

$ find . -type f -name "$filename"      |
  sort -t_ -nk5.1,5.2 -nk6.4,6.6        |
  xargs -r awk 'FNR==2{print;nextfile}' \
> new_text_file;

GNUの使用sed:

$ find . -type f -name "$filename" |
  sort -t_ -nk5.1,5.2 -nk6.4,6.6   |
  xargs -r sed -se '2!d'           \
> new_text_file;

そしてperl：

$ find . -type f -name "$filename"                |
  sort -t_ -nk5.1,5.2 -nk6.4,6.6                  |
  xargs -r perl -ne 'print,close ARGV if $. == 2' \
> new_text_file;

そしてhead/tail：

$ find . -type f -name "$filename" |
  sort -t_ -nk5.1,5.2 -nk6.4,6.6   |
  xargs -r \
   sh -c '
    for f
    do
     head -n 2 "$f" | tail -n 1
    done
   ' x > new_text_file;

Question 2

なぜ簡単ではないのですか？

awk 'FNR == 2' *FstRslts > NewFile

？コマンドラインが長すぎる場合は、入力ファイルをサブセグメンテーションでグループ化するか、xargs行分割を試してください。

Answer

なぜ簡単ではないのですか？

awk 'FNR == 2' *FstRslts > NewFile

？コマンドラインが長すぎる場合は、入力ファイルをサブセグメンテーションでグループ化するか、xargs行分割を試してください。

Question 3

zshバージョン（Mac端末のデフォルトシェル）：

for file in $(find . -type f -iname "*.txt"); cat "$file" | head -2 | tail -1 >> output.txt

これは、すべての入力テキストファイルが同じディレクトリにあり、ファイルが処理される順序が重要ではないと仮定します。

bashバージョン:

for file in $(find . -type f -iname "*.txt"); do cat $file | head -2 | tail -1; done >> output.txt

編集1：echoコマンドの置換について、NasirとSteeldriverの提案に従う必要はありません。以下はawkバージョンです。

for file in $(find . -type f -iname "*.txt"); awk 'NR==2' $file >> output.txt

また、ファイルに拡張子がない場合は、txtすべてのファイルに共通のパターンを使用できます。すべてのファイルのFile名前に対応する名前があると仮定すると、awkバージョンは次のようになります。

for file in $(find . -type f -iname "*File*"); awk 'NR==2' $file >> output.txt

編集2：

言及した内容によると、FstRslts合計はGenDivRsltsファイルグループの一意の識別子です。したがって、ファイル"*FstRslts"にFstRslts代わりに使用できます"*.txt"。GenDivRslts

ノート

私は@steeldriversのアドバイスとレッスンを受け入れ、答えの1つとして以下を追加します（より慣用的です）。

find . -type f -iname "*FstRslts" -exec awk 'NR==2' {} \; > output.txt

編集3 find .- 現在の作業ディレクトリから検索を開始

type -f- ファイル形式の検索

-iname "*FstRslts"- パターンに一致するファイル名検索時の大文字と小文字を無視

-exec- 次のコマンドを実行します。

awk 'NR==2'- 前のコマンドで見つかった各ファイルの2行目の抽出（一致するパターン）

{} \;- ファイル（パターン一致）コマンドを終了するためのプレースホルダ

> output.txt- 結果を「output.txt」ファイル名にリダイレクトします。

Answer