
私のファイルのデータは次のとおりです。
START-OF-FIELDS
ID
NAME
DEPT
END-OF-FIELDS
START-OF-DATA
1|joy|cs
2|sam|ec
END-OF-DATA
START-OF-FIELDS
ID
NAME
DOB
DEPT
ADDRESS
END-OF-FIELDS
START-OF-DATA
5|joe|13/2/2001/|ee|street1
3|gwen|4/08/1999|cs|street2
END-OF-DATA
期待される出力:-
ID
NAME
DEPT
データセット 1 の数は 3 です。
ID
NAME
DOB
DEPT
ADDRESS
データセット 2 の数は 5 であり、動的番号付けの場合も同様です。データセット。
開始フィールドと終了フィールドの間、開始データと終了データの間のデータ数を計算したいと思います。誰でも私にこれを行う正確なコードを与えることができますか?使った
sed -n '/^START-OF-FIELDS/,/END-OF-FIELDS/{s/^START-OF-FIELDS//;/^END-OF-FIELDS/d;p;}' Sourcefile.txt > START_OF_FIELDS.TXT
wc -l START_OF_FIELDS.TXT
しかし、望む結果は得られません。
答え1
新しい、より良い問題の説明を考慮すると、実際には簡単です。
#!/bin/bash
awk 'BEGIN {
SETNR=0;
MODE="Non-Fields"}
(MODE=="Fields") && (! /START-OF-/ ) && (! /END-OF/ ) {
print;
COUNT++
}
/START-OF-FIELDS/ {
COUNT=0;
SETNR++;
MODE="Fields"
}
/END-OF/ {
if (MODE=="Fields") {
printf ("Count for data set %d is: %d\n", SETNR, COUNT)
};
MODE="Non-Fields"
}' $*
答え2
解決策awk
:
$ awk '/END-OF/{flag=0;printf "Count for data set %d is: %d\n",++i,count;count=0;printf "\n"}
{if(flag){
count++;
print;
}}
/START-OF/{flag=1}' file
ID
NAME
DEPT
Count for data set 1 is: 3
1|joy|cs
2|sam|ec
Count for data set 2 is: 2
ID
NAME
DOB
DEPT
ADDRESS
Count for data set 3 is: 5
5|joe|13/2/2001/|ee|street1
3|gwen|4/08/1999|cs|street2
Count for data set 4 is: 2
答え3
あなたの問題はよりよく定義されるべきですが、あなたの例の入力を見ると、あなたが望むものが何であるかを推測しています。次の小さなAWKスクリプトを使用してください。
#!/bin/bash
awk '! /START-OF-/ {
if (MODE=="DEFINE") { HEADER=HEADER $0 "|" }
else if ((MODE=="DATA") && (NF>0)) { print }
}
/START-OF-FIELDS/ { MODE="DEFINE"; HEADER="" }
/START-OF-DATA/ {
print HEADER
MODE="DATA"
HEADER=""
}' | sed 's/|$//'
これで以下が生成されます。
ID|NAME|DEPT
1|joy|cs
2|sam|ec
ID |NAME|DOB|DEPT|ADDRESS
5|joe|13/2/2001/|ee|street1
3|gwen|4/08/1999|cs|street2
注:私は怠惰で、ヘッダーの各フィールドの後に垂直バーを追加しました。その後、SEDコマンドを使用して末尾のVバーを削除しました。
答え4
sed -n '/^START-OF-DATA$/,/^$/{/^START-OF-DATA$/d;/^$/d;p;}' filename
それは:
START-OF-DATA
- と次の空行の間の行を収集します/^START-OF-DATA$/,/^$/
。次の行を使用すると:- 区切り線を削除
/^START-OF-DATA$/d
して/^$/d
- 残りは印刷してください -
p
- 区切り線を削除