カンマ区切りのテキストから列を抽出する

Question 1

awk -F , -v OFS='\t' 'NR == 1 || $6 > 4 {print $1, $6, $7, $8}' input.txt

Answer

awk -F , -v OFS='\t' 'NR == 1 || $6 > 4 {print $1, $6, $7, $8}' input.txt

Question 2

私はawkが最善の解決策であることに同意します。あなたできるこれはbashの他のいくつかのツールを使って行うことができます：

cut -d , -f 2,6,7,8 filename | {
    read header
    tr , $'\t' <<< "$header"
    while IFS=, read -r id num4 num5 num6; do
        # bash can only do integer arithmetic
        if [[ $(bc <<< "$num4 >= 4.0") = 1 ]]; then
           printf "%s\t%s\t%s\t%s\n" "$id" "$num4" "$num5" "$num6"
        fi
    done
}

Answer

私はawkが最善の解決策であることに同意します。あなたできるこれはbashの他のいくつかのツールを使って行うことができます：

cut -d , -f 2,6,7,8 filename | {
    read header
    tr , $'\t' <<< "$header"
    while IFS=, read -r id num4 num5 num6; do
        # bash can only do integer arithmetic
        if [[ $(bc <<< "$num4 >= 4.0") = 1 ]]; then
           printf "%s\t%s\t%s\t%s\n" "$id" "$num4" "$num5" "$num6"
        fi
    done
}

Question 3

上記のawkスクリプトに勝つ方法は実際にはありませんが、ここにRubyソリューションがあります。

#!/usr/bin/ruby1.9.1

puts "id\tnumber4\tnumber5\tnumber6"

ARGF.each_line do |line|
  arr = line.split(',')
  puts "#{arr[1]}\t#{arr[5]}\t#{arr[6]}\t#{arr[7]}" if arr[5].to_f > 4.0
end

スクリプトを使用するには、ファイル名で呼び出すか、ファイルをパイプでリンクします。

Answer

上記のawkスクリプトに勝つ方法は実際にはありませんが、ここにRubyソリューションがあります。

#!/usr/bin/ruby1.9.1

puts "id\tnumber4\tnumber5\tnumber6"

ARGF.each_line do |line|
  arr = line.split(',')
  puts "#{arr[1]}\t#{arr[5]}\t#{arr[6]}\t#{arr[7]}" if arr[5].to_f > 4.0
end

スクリプトを使用するには、ファイル名で呼び出すか、ファイルをパイプでリンクします。

Question 4

Perlソリューション：

perl -F, -le '$, = "\t"; print @F[1,5,6,7] if $F[5] > 4 || $. == 1' file

-F,分割するモードを指定します。-F暗黙の設定-a

-aと一緒に使用すると、自動分割モードがオンになります-n。配列に対する暗黙の分割コマンドは、生成された暗黙の@Fwhileループ内で最初に実行されます-n。-a暗黙の設定-n

-nPerlは、プログラムの周りにループがあると仮定してファイル名引数を繰り返すようにしますsed -n。awk

-l自動改行処理を有効にします。 2つの異なる効果があります。まず、入力レコード区切り記号（）を自動的に切り捨てます\n。次に、出力レコード区切り文字をに割り当てます\n。

-e1行プログラムを入力するために使用されます。

したがって、perl -F, -le '$, = "\t"; print @F[1,5,6,7] if $F[5] > 4 || $. == 1'次のようにします。

use English;

$OUTPUT_RECORD_SEPARATOR = $INPUT_RECORD_SEPARATOR;

while (<>) { # iterate over each line of the each file
    chomp;
    @F = split(',');
    $OUTPUT_FIELD_SEPARATOR = "\t";
    print @F[1,5,6,7] if $F[5] > 4 || $INPUT_LINE_NUMBER == 1;
}

Answer

Perlソリューション：

perl -F, -le '$, = "\t"; print @F[1,5,6,7] if $F[5] > 4 || $. == 1' file

-F,分割するモードを指定します。-F暗黙の設定-a

-aと一緒に使用すると、自動分割モードがオンになります-n。配列に対する暗黙の分割コマンドは、生成された暗黙の@Fwhileループ内で最初に実行されます-n。-a暗黙の設定-n

-nPerlは、プログラムの周りにループがあると仮定してファイル名引数を繰り返すようにしますsed -n。awk

-l自動改行処理を有効にします。 2つの異なる効果があります。まず、入力レコード区切り記号（）を自動的に切り捨てます\n。次に、出力レコード区切り文字をに割り当てます\n。

-e1行プログラムを入力するために使用されます。

したがって、perl -F, -le '$, = "\t"; print @F[1,5,6,7] if $F[5] > 4 || $. == 1'次のようにします。

use English;

$OUTPUT_RECORD_SEPARATOR = $INPUT_RECORD_SEPARATOR;

while (<>) { # iterate over each line of the each file
    chomp;
    @F = split(',');
    $OUTPUT_FIELD_SEPARATOR = "\t";
    print @F[1,5,6,7] if $F[5] > 4 || $INPUT_LINE_NUMBER == 1;
}

カンマ区切りのテキストから列を抽出する

答え1

答え2

答え3

答え4

関連情報