次のテキストがあります。
Name= Garen
Class= 9C
School= US
Name= Lulu
Class= 4A
Name= Kata
Class= 10D
School= UK
次のawk cmdを取得しました。
awk '$Name ~/Name/ {printf $0;} $Class ~/Class/ {printf $0;} $School ~/School/ {print $0;} ' file.txt
しかし、新しい行に出力されます。このように:
Name= Garen Class= 9C School= US
Name= Lulu Class= 4A Name= Kata Class= 10D School= UK
次のように出力したいと思います。
Name= Garen ,Class= 9C ,School= US
Name= Lulu , Class= 4A ,
Name= Kata ,Class= 10D ,School= UK
次のような状況が発生した場合:
Name= Garen
Class= 9C
Last Name= Wilson
School= US
Name= Lulu
Class= 4A
Last Name= Miller
Name= Kata
Class= 10D
School= UK
Last Name= Thomas
そして印刷してください:
Name= Garen,Class= 9C,School= US
Name= Lulu,Class= 4A
Name= Kata,Class= 10D,School= UK
答え1
$ awk -v OFS=',' '/^Name/ { if (line != "") print line; line = $0; next } { line = line OFS $0 } END { if (line != "") print line }' file
Name= Garen,Class= 9C,School= US
Name= Lulu,Class= 4A
Name= Kata,Class= 10D,School= UK
質問に更新された入力を使用すると、次の結果が得られます。
Name= Garen,Class= 9C,Last Name= Wilson ,School= US,
Name= Lulu,Class= 4A,Last Name= Miller,
Name= Kata,Class= 10D,School= UK,Last Name= Thomas
このビットを削除するには、Last Name
コードで明示的に無視してくださいawk
。
$ awk -v OFS=',' '/^Last Name/ { next } /^Name/ { if (line != "") print line; line = $0; next } { line = line OFS $0 } END { if (line != "") print line }' file
Name= Garen,Class= 9C,School= US,
Name= Lulu,Class= 4A,
Name= Kata,Class= 10D,School= UK
このコードは、コメントを含むスタンドアロンプログラムawk
として提供されています。awk
BEGIN {
# Set output field separator to a comma.
# This can also be done with -v OFS="," on the command line.
OFS = ","
}
/^Last Name/ {
# Ignore these lines
next
}
/^Name/ {
# A line starts with "Name".
# Print the accumulated line and reset the line variable.
# Continue immediately with next line of input.
if (line != "")
print line
line = $0
next
}
{
# Accumulate lines in the line variable.
# Delimit each input data with OFS (a comma).
line = line OFS $0
}
END {
# Print the last accumulated line.
if (line != "")
print line
}
(sed
これはほぼ同じ解決策です。他の質問の答え)
/^Last Name/ d; # ignore these lines
/^Name/ b print_previous; # print previous record
H; # append this line to hold space
$ b print_previous; # print previous (last) record
d; # end processing this line
:print_previous; # prints a record accumulated in the hold space
x; # swap in the hold space
/^$/ d; # if line is empty, delete it
s/\n/,/g; # replace embedded newlines by commas
# (implicit print)
実行してください:
$ sed -f script.sed file
Name= Garen,Class= 9C,School= US
Name= Lulu,Class= 4A
Name= Kata,Class= 10D,School= UK
答え2
awk
以下のように1行のコードを使用してこれを達成できます。
awk -F\< '/Name=/ {LGT=length($2);printf("\n%s,",substr($2,6,LGT))};
/Class=/ {LGT=length($2);printf(" %s,",substr($2,6,LGT))};
/School=/ {LGT=length($2);printf(" %s",substr($2,6,LGT))};
END {printf("\n") }' file.txt
このソリューションは、file.txt
に表示される順序でレコード(つまり元のファイルの行)を印刷しますfile.txt
。 awk
.
前の回答からわかるように、file.txtには次のものが含まれます。
<text>Name= Garen</text>
<text>Class= 9C</text>
<text>School= US</text>
<text>Name= Lulu</text>
<text>Class= 4A</text>
<text>Name= Kata</text>
<text>Class= 10D</text>
<text>School= UK</text>
出力は次のとおりです
Name= Garen, Class= 9C, School= US
Name= Lulu, Class= 4A
Name= Kata, Class= 10D, School= UK
答え3
awk '$Name ~/Name/ {printf $0;} $Class ~/Class/ {printf $0;} $School ~/School/ {print $0;} ' file.txt
All $Name
、$Class
および$School
はと全く同じように動作します$0
。なぜなら、そして変数Name
は未定義で、andの数値を持つ未定義の変数(少なくともandについては)では、演算子は単に引数を数値に変換するからです。他の実装はエラーで終了することがあります(この動作は標準で指定されていません)。Class
School
awk
0
mawk
gawk
$
awk
この試み:
awk -F ' *= *' '$1~/^(Name|Class|School)$/{
if($1 in a){ for(i in a) delete a[i]; comma = ""; printf ORS }
printf "%s%s= %s", comma, $1, $2; a[$1] = comma = ", "
}
END{if(comma) printf ORS}
' file.txt
Name= Garen, Class= 9C, School= US
Name= Lulu, Class= 4A
Name= Kata, Class= 10D, School= UK
上記の例は、順序に関係なく、キー/値タプルをグループ化しようとします(一般的です)。同じパターンが削除された場合は最初のサンプル入力で$1~/.../
)しかし、これが常に最初であり、常に存在することを知っていれば、すべてName
がはるかに簡単になります。
awk '/^Name=/{printf "%s%s", nl, $0; nl=ORS}
/^(Class|School)=/{printf ", %s", $0}
END{if(nl) printf ORS}' /tmp/file.txt