ファイルを解析するためのawkコマンド

Question 1

awk 'NR > 1 { for (i = 6; i <= NF; i++) if ($i < 100) $i = "NA" }; 1' yourfile.txt

拡張コメント：

NR > 1 {                         # skipping NR == 1, the first line
    for (i = 6; i <= NF; i++)    # column 6 to the end, skipping first 5
        if ($i < 100) $i = "NA"  # self-explanatory
}

1 # print all lines; 1 evaluates to true, and default action is print

編集：これを設定する方法はいくつかありますOFS。私が考えることができる最もきれいな方法は、OFS='\t'ファイル名を前に付けることです。

awk '...' OFS='\t' file.txt
awk -v OFS='\t' '...' file.txt
awk 'BEGIN { OFS="\t" }; ...' file.txt

Answer

awk 'NR > 1 { for (i = 6; i <= NF; i++) if ($i < 100) $i = "NA" }; 1' yourfile.txt

拡張コメント：

NR > 1 {                         # skipping NR == 1, the first line
    for (i = 6; i <= NF; i++)    # column 6 to the end, skipping first 5
        if ($i < 100) $i = "NA"  # self-explanatory
}

1 # print all lines; 1 evaluates to true, and default action is print

編集：これを設定する方法はいくつかありますOFS。私が考えることができる最もきれいな方法は、OFS='\t'ファイル名を前に付けることです。

awk '...' OFS='\t' file.txt
awk -v OFS='\t' '...' file.txt
awk 'BEGIN { OFS="\t" }; ...' file.txt

Question 2

jw013はすでに良いawkソリューションを提供していますが、Perlに言及して以来：

perl -lane 'map{$_="NA" if $_<100}@F[5..$#F] if $.>1; print join "\t", "@F"' file

説明する

perl -lane：各入力行を処理し（-n）、スペースで配列@F（-a）に分割し、指定されたスクリプトを実行します-e。各行から末尾の改行を削除し、-l各ステートメントに追加します。\nprint
map{$_="NA" if $_<100}@F[5..$#F]：@F 配列の6番目から最後までの各要素（フィールド）が100未満の場合、その要素を「NA」に変更します。
if $.>1;: 前の内容は、map{}最初の行でない場合にのみ実行されます。
print join "\t", "@F"'：@Fタブを使用して配列の各要素を連結し（jw013の回答の説明で要求）、印刷します。

Answer

jw013はすでに良いawkソリューションを提供していますが、Perlに言及して以来：

perl -lane 'map{$_="NA" if $_<100}@F[5..$#F] if $.>1; print join "\t", "@F"' file

説明する

perl -lane：各入力行を処理し（-n）、スペースで配列@F（-a）に分割し、指定されたスクリプトを実行します-e。各行から末尾の改行を削除し、-l各ステートメントに追加します。\nprint
map{$_="NA" if $_<100}@F[5..$#F]：@F 配列の6番目から最後までの各要素（フィールド）が100未満の場合、その要素を「NA」に変更します。
if $.>1;: 前の内容は、map{}最初の行でない場合にのみ実行されます。
print join "\t", "@F"'：@Fタブを使用して配列の各要素を連結し（jw013の回答の説明で要求）、印刷します。

Question 3

sed '1n;s|$| |;:na
    s|\([+-] .*\) [+-]*[0-9]\{1,2\} |\1 NA |
    t na;s| $||'

あなたが示したデータをsed s///;t見ると、この小さな機能が機能しない理由はありません。（私が逃したかもしれない最後のコラムを指摘してくれたjw013に感謝します。）これは、置き換える内容がなくなるまで、1行+/-からaの後の1〜2桁の数字のすべての文字列をその前のすべての文字列に置き換えます。NA

sed以下は、再帰のない既存のスペースを活用する別のバージョンですh。

sed '1n;h;s|.*[+-] ||;s|$| |
    s| [+-]*[0-9]\{1,2\} | NA |g
    x;G;s|\([+-] *\).*\n|\1|;s| $||'

これは同じマーカーと分割線に依存します。前半部分はh前の空間では変更されずにそのまま残り、パターン空間では完全に除去される。次に、1,2 個の数字の単語をすべてグローバルに置き換え、前のスペースに追加し、hパターンと前のスペースを変更し、x追加操作の結果として挿入されたhタグと ewline の間のすべての項目を削除します。\n

Answer

sed '1n;s|$| |;:na
    s|\([+-] .*\) [+-]*[0-9]\{1,2\} |\1 NA |
    t na;s| $||'

あなたが示したデータをsed s///;t見ると、この小さな機能が機能しない理由はありません。（私が逃したかもしれない最後のコラムを指摘してくれたjw013に感謝します。）これは、置き換える内容がなくなるまで、1行+/-からaの後の1〜2桁の数字のすべての文字列をその前のすべての文字列に置き換えます。NA

sed以下は、再帰のない既存のスペースを活用する別のバージョンですh。

sed '1n;h;s|.*[+-] ||;s|$| |
    s| [+-]*[0-9]\{1,2\} | NA |g
    x;G;s|\([+-] *\).*\n|\1|;s| $||'

これは同じマーカーと分割線に依存します。前半部分はh前の空間では変更されずにそのまま残り、パターン空間では完全に除去される。次に、1,2 個の数字の単語をすべてグローバルに置き換え、前のスペースに追加し、hパターンと前のスペースを変更し、x追加操作の結果として挿入されたhタグと ewline の間のすべての項目を削除します。\n

ファイルを解析するためのawkコマンド

答え1

答え2

説明する

答え3

関連情報