Grep を使用して文字列を検索し、レコードから文字列をエコーし​​ます。

Grep を使用して文字列を検索し、レコードから文字列をエコーし​​ます。

私は以下の記録を持っています:

MiraServ.log.10:2016/02/07 15:25:13 3 All stations busy!!
MiraServ.log.10:2016/02/07 15:25:13 1 TranHasError (3627,-2) EDxxxxxxxxxxxxxxx,MI1,IN0019093203,A113214,TK00:027031636:0617:_:V:166056:_:LCLCOCMSN1:LCLCOCMSN1:1448175096,MTR,VOMiraServJava_2_0_13,TH3627,CY124,TC11,SIZ01572S?,O9i5LLI1Yd2XgI90oZ,OA01,HDxxxxxxxxxxxxxx,ABD,RC776,AR776,OMNOT COMPLETED,ODSTATION BUSY,DMNOT COMPLETED,RENOT COMPLETED,RMNOT COMPLETED,RYL
MiraServ.log.10:2016/02/07 15:25:13 1 Request  -> EDxxxxxxxxxxxxxxx,MI1,IN0019093203,A113214,TK00:027031636:0617:_:V:166056:_:LCLCOCMSN1:LCLCOCMSN1:1448175096,MTR,VOMiraServJava_2_0_13,TH3627,CY124,TC11,SIZ01572S?,O9i5LLI1Yd2XgI90oZ,OA01,HDxxxxxxxxxxxxxx,ABD,RC776,AR776,OMNOT COMPLETED,ODSTATION BUSY,DMNOT COMPLETED,RENOT COMPLETED,RMNOT COMPLETED,RYL,ATV,CDVisa,OL01
MiraServ.log.10:2016/02/07 15:25:13 1 TxSendPOSResp 0 5 (661) -> EDxxxxxxxxxxxxxxx,MI1,IN0019093203,A113214,TK00:027031636:0617:_:V:166056:_:LCLCOCMSN1:LCLCOCMSN1:1448175096,MTR,VOMiraServJava_2_0_13,TH3627,CY124,TC11,SIZ01572S?,IDi5LLI1Yd2XgI90oZ,OA01,HDxxxxxxxxxxxxxx,ABD,RC776,AR776,OMNOT COMPLETED,ODSTATION BUSY,DMNOT COMPLETED,RENOT COMPLETED,RMNOT COMPLETED,RYL,ATV,CDVisa,OL01,SRN,VEN,CL01,RL01,RO776,RUN,RI  ,CX** TRANSACTION RECORD **\n\nTran. #: 3627\n\nVisa Credit Auth Only\nxxxxxxxxxxxx6056 S\n\n       Amount CAD$132.14\n\n########################\n     NOT COMPLETED      \n########################\n      (776) \nZ01572S?/\nInvoice #: 0019093203\n2016/02/07 15:25:13\n\n     Customer Copy\n,DECredit Auth Only

「ODSTATION BUSY」に対してgrepを実行し、見つかった場合(上記のレコードに示すように)、「Invoice#:」の後に続く整数をエコーする必要があります。0019093203この場合、次のようになります。

ファイルには文字通り何千ものレコードがあり、.log上記の文字列を含むすべてのレコードの請求書番号を取得する必要があります。 Bashでこれをやりたいです。

答え1

perl -e 'while(<>) {if ($_ =~ qr/ODSTATION BUSY/) { print "$1\n" if $_ =~ /Invoice #:\s+(\d+)/ } }' <yourfile_goes_here>

ああ、バッシュ?

grep 'ODSTATION BUSY' filename |egrep -o 'Invoice[^0-9]+[0-9]+'|egrep -o '[[:digit:]]+'

または:

awk 'BEGIN{$0 ~ /ODSTATION BUSY/}; gsub(/^.*Invoice #: /,""){print $1}' filename |sed 's/\\n.*$//g'

答え2

サンプルデータから0019093203を生成するPOSIX準拠のsedソリューション(請求書情報が「ODSTATION BUSY」の後にあると仮定):

sed '/.*ODSTATION BUSY.*Invoice #: */!d; s///; s/\\n.*//' file

両方のケースを処理するdon_crisstiメソッドの調整バージョン:

sed -n '/ODSTATION BUSY/s/.*Invoice #: \([0-9]\{1,\}\)\\n.*/\1/p' file

答え3

これを行う1つの方法は次のとおりです。

$ grep "ODSTATION BUSY" <filename> | sed 's/^.*Invoice #://;s/\n.*$/'

これはとても醜いことですawk

答え4

行が多すぎる場合(たとえば、何千もの)、メモリにインポートしてシステムにロードを引き起こすよりも一時ファイルを使用する方が好きですが、これが私が好む方法です。

grep "ODSTATION BUSY" logfile > workfile
cat workfile | while read line
do
  invoffset=$(echo ${line} | grep -b -o "Invoice #:"|cut -d: -f1)   #locates string position from the beginning of the string
  invoiceno=$(echo ${line} | cut -c ${invoffset}- | cut -d: -f2 | cut -d"\\" -f1)  # cuts the beginning part of the string, then cuts what is before :, then cuts what is after \
  echo ${invoiceno}
done

関連情報