ファイル1があります。
col1=val1|col2=val2|col3=val3|col4=val4
col1=val1|col2=val2|col4=val4|col5=val5|col6=val6
col1=val1|col3=val3|col4=val4|col6=val6
col1=val1|col2=val2|col3=val3|col4=val4|col5=val5|col6=val6
そして、file2の一意の列のリストは次のとおりです。
col1
col2
col3
col4
col5
col6
file2列シーケンスに基づいてパイプ区切り文字を使用して、別のファイル内のfile1からその値を取得する必要があります。
出力は次のとおりです。
val1|val2|val3|val4|||
val1|val2||val4|val5|val6
val1||val3|val4||val6
val1|val2|val3|val4|val5|val6
答え1
名前=値のペアでデータを入力するたびに最善の方法は、まず名前->値の配列を作成し、名前付きインデックスでその配列の内容を印刷することです。この場合、これらの名前の順序は他のファイルから来るので、そのファイルを最初に読んでください。
$ cat tst.awk
BEGIN { FS="[=|]"; OFS="|" }
NR==FNR { outFldNames[++numOutFlds]=$0; next }
{
delete name2val
for (inFldNr=1; inFldNr<NF; inFldNr++) {
name2val[$inFldNr] = $(inFldNr+1)
}
for (outFldNr=1; outFldNr<=numOutFlds; outFldNr++) {
printf "%s%s", name2val[outFldNames[outFldNr]], (outFldNr<numOutFlds ? OFS : ORS)
}
}
$ awk -f tst.awk file2 file1
val1|val2|val3|val4||
val1|val2||val4|val5|val6
val1||val3|val4||val6
val1|val2|val3|val4|val5|val6
答え2
perl -wMstrict -Mvars='*A' -lne '
if ( @ARGV ) { push @A, $_; }
else {
my %h = /([^|=]+)=([^|]+)/g;
$,="|"; print map { $h{$_} // (($_ eq $A[-1]) ? q/|/ : q//) } @A;
}
' file2 file1
出力の最初の行を確認してください。これには3つのパイプがあります。だからmap
ロジックはこれです。
出力
val1|val2|val3|val4|||
val1|val2||val4|val5|val6
val1||val3|val4||val6
val1|val2|val3|val4|val5|val6
答え3
$ cat file1
col1=val1|col2=val2|col3=val3|col4=val4
col1=val1|col2=val2|col4=val4|col5=val5|col6=val6
col1=val1|col3=val3|col4=val4|col6=val6
col1=val1|col2=val2|col3=val3|col4=val4|col5=val5|col6=val6
file2にリストされていない列が省略されたことを示すために、file2を変更しました。
$ cat file2
col1
col2
col4
col5
col6
スクリプト:
#!/bin/bash
patterns="$(tr '\n' '|' < file2| sed 's/|$//')"
awk -F'|' -v pat="$patterns" '{
o=0
for (i=1; i<=6; i++) {
f=i-o
split($f,a,"=")
if ( a[1] ~ i ) {
if ( a[1] ~ pat ) {
printf "%s", a[2]
}
if (i != 6) {printf "|"}
} else {
printf "|"
o++
}
}
printf "\n"
}' file1
col3 値なしで出力:
$ ./script
val1|val2||val4|||
val1|val2||val4|val5|val6
val1|||val4||val6
val1|val2||val4|val5|val6
答え4
awkと手動マッピングを使用した古典的なプログラミングアプローチは次のとおりです。
$ awk -F"[=|]" 'NR==FNR{header[++c]=$1;next}\
{
record="";
for (h=1;h<=c;h++)
{
found="*";
for (field=1;field<=NF;field+=2) \
{
if ($field==header[h])
{found=$(field+1);break}
};
record=record "|" found;
}
print record
}' file2 file1
#Output:
|val1|val2|val3|val4|*|*
|val1|val2|*|val4|val5|val6
|val1|*|val3|val4|*|val6
|val1|val2|val3|val4|val5|val6
他のfile2の場合 - 次のような他の列の順序
col6
col4
col3
col5
col2
col1
したがって、出力は次のようになります。
|*|val4|val3|*|val2|val1
|val6|val4|*|val5|val2|val1
|val6|val4|val3|*|*|val1
|val6|val4|val3|val5|val2|val1