パターンマッチング後の複数行の連結

パターンマッチング後の複数行の連結

次のデータを含むファイルがあります。

STUDENT DETAILS
NAME MARKS STD
XYZ 20 I
RANK SCHOOL TEACHER GRADE
5 TTT ANON B
POSITION
5
STUDENT DETAILS
NAME MARKS STD
ABC              40                I
RANK SCHOOL TEACHER GRADE
5 TTT ANON A
POSITION
5

私の出力は次のとおりです。

NAME MARKS STD RANK SCHOOL TEACHER GRADE POSITION
XYZ  20     I   5    TTT   ANON    B     5
ABC  40     I   5    TTT   ANON    A     5

STUDENT DETAILSawkパターンを見つけて2番目、5番目、8番目の行を印刷してみました。しかし、線を接続する必要があります。

私は走る:

awk '/STUDENT DETAILS/{nr[NR];nr[NR+2]; nr[NR+5]; nr[NR+8]}; END {for (i in nr) print nr[i]}' file.txt > filenew.txt

この目標をどのように達成できますか?

答え1

awkではあらかじめ読むことができず、パターンを覚えておく必要があります。

awkファイル(下のu.awk)

/STUDENT/ { li=NR;}
NR == li+2 { mark[li]=$0 }
NR == li+4 { pos[li]=$0 }
END { for (m in mark) printf "%s %s\n",mark[m],pos[m] ;}

どこ

  • /STUDENT/ { li=NR;}レコードが始まる行を覚えておいてください
  • NR == li+2 { mark[li]=$0 }現在の動作が+2のときの表示を覚えています(位置も同じ)。

サンプルデータとして実行すると(空白行を削除し、実際のファイルにある場合は+2 / +4を調整します)

awk -f u.awk liste-1.txt

XYZ 20 I 5 TTT ANON B
ABC              40                I 5 TTT ANON A

ヘッダ生成は省略されます。

答え2

データをレコードに事前に分割する場合は、関連フィールドを印刷する必要はありません。

# Pre-splitting
sed '/^STUDENT/ { 1!s/^/\n/; }' infile |

# Reorder the record:
awk -v RS= -v FS='\n' '
  NR == 1 { print $2, $4, $6 }
          { print $3, $5, $7 }'        |

# Pretty-print columns
column -t

出力:

NAME  MARKS  STD  RANK  SCHOOL  TEACHER  GRADE  POSITION
XYZ   20     I    5     TTT     ANON     B      5
ABC   40     I    5     TTT     ANON     A      5

答え3

awk '
    BEGIN { OFS="\t"; maxLines=7 }
    { lineNr=(NR-1) % maxLines + 1; $1=$1; lines[lineNr]=$0 }
    NR == maxLines     { print lines[2], lines[4], lines[6] }
    lineNr == maxLines { print lines[3], lines[5], lines[7] }
' file
NAME    MARKS   STD     RANK    SCHOOL  TEACHER GRADE   POSITION
XYZ     20      I       5       TTT     ANON    B       5
ABC     40      I       5       TTT     ANON    A       5

答え4

Tested with below script and it worked fine


STEP1:

header=`sed '/STUDENT/d' r.txt |sed -n '1~2p'| sort | uniq| sed "N;s/\n/ /g"| sed "N;s/\n/ /g"`

count=`sed '/STUDENT/d'  o.txt|wc -l`
sed -i '/STUDENT/d' o.txt

STEP2:
for ((i=1;i<=$count;i++)); do j=$(($i+5)); sed -n ""$i","$j"p" o.txt| sed -n '2~2p'|sed -r "s/\s+/ /g"|sed "N;s/\n/ /g"|sed "N;s/\n/ /g"; i=$j; done| awk -v header="$header" 'BEGIN{print header}{print $0}'| sed "s/ /\t/g"

関連情報