こんにちは。主キーを使用して同じタイプの最後のレコード値を取得しようとしています。
リスト.csv
tag1,slate1,flag1,check1,1,2
tag2,slate2,flag2,check2,1,2
tag3,slate3,flag3,check3,1,2
tag1,slate1,flag1,check1,3,4
tag3,slate3,flag3,check3,1,2
ここで主キーは col1+col2+col3+col4 です。
このレコードに新しいレコードを挿入する必要があります。
tag1,slate1,flag1,check1,5,6
同じタイプの最後のレコードをインポートする必要があります。 [レコードが多い場合は、最後の同じ主キーレコードを取得する必要があります。] [tag1,slate1,flag1,check1,3,4 ] そして 3 ,4 の値を取得し、次のレコードのように作成します。
tag1,slate1,flag1,check1,5,6,3,4
努力していますが、期待した結果は得られませんでした。
awk -F, '!dup[$1,$2,$3,$4]++' list.csv - removing duplicates , but able to fetch expected record
awk -F, '!dup["tag1","slate1","flag1","check1"]++' list.csv
「tag1,slate1,flag1,check1,5,6」の値を入力し、以下のような出力を期待します。
tag1,slate1,flag1,check1,5,6,3,4
"tag4,slate4,flag4,check4,8,9" レコードが存在しない場合、出力は次のようになります。
tag4,slate4,flag4,check4,8,9,NILL,NILL
答え1
awk -v add='tag1,slate1,flag1,check1,5,6' '
BEGIN{ FS=OFS=","; split(add, arr, ",") }
($1==arr[1] && $2==arr[2] && $3==arr[3] && $4==arr[4]) { append=$5 FS $6 }
END{ print add, (append?append:"NULL,NULL") }' infile
出力:
tag1,slate1,flag1,check1,5,6,3,4
または別の方法で実行してください。
awk -v add='tag4,slate4,flag4,check4,8,9' '
BEGIN{ FS=OFS="," }
{ key=$1 FS $2 FS $3 FS $4; if(index(add, key)==1) append=$5 FS $6 }
END{ print add, (append?append:"NULL,NULL") }' infile
出力:
tag4,slate4,flag4,check4,8,9,NULL,NULL
答え2
アッ
add='tag1,slate1,flag1,check1,5,6'
awk -F ',' -v add="$add" '
BEGIN {
key = add; sub(/(,[^,]+){2}$/, "", key)
tupl = ",NIL,NIL"
}
{
do{
if (index($0, key FS) == 1)
tupl = FS $(NF-1) FS $NF
} while (getline > 0)
$0 = add tupl
};1
' list.csv
tag1,slate1,flag1,check1,5,6,3,4
GNU sed拡張正規表現モードオン-E
# helper variables that make it easy to look
# at n process the pattern space in terms of fields
s=, S="[^$s]"
F=$s$S+ F2="($F){2}"
add='tag1,slate1,flag1,check4,5,6'
sed -Ee "
1{H;z;x;s/^/$add/;ba;}
:loop
\$tend
N
:a
/^(.*)$F2\n\1$F2\$/h
s/\n.*//
bloop
:end
G;s/\n\$/,NIL,NIL/;t
g;s/\n.*($F2\$)/\1/
" list.csv
tag1,slate1,flag1,check4,5,6,NIL,NIL