レコードタイプ別にレコードを分割し、予期しないレコードタイプを報告します。

Question 1

これは一つのawk方法です。まず、「良い」レコードが1行に1つずつ含まれるファイルを作成します。

$ cat goodRecs 
E20
I47
I49
I50
Q11
R11
W55

それから：

gawk 'FNR==NR{good[$1]; next} 
     { 
        rec=substr($1,27,3); 
        if(rec in good){
            print > rec".txt"
        }
        else{
            print "Bad record: "rec
        }
    }' goodRecs myfile.txt

Answer

これは一つのawk方法です。まず、「良い」レコードが1行に1つずつ含まれるファイルを作成します。

$ cat goodRecs 
E20
I47
I49
I50
Q11
R11
W55

それから：

gawk 'FNR==NR{good[$1]; next} 
     { 
        rec=substr($1,27,3); 
        if(rec in good){
            print > rec".txt"
        }
        else{
            print "Bad record: "rec
        }
    }' goodRecs myfile.txt

Question 2

awkとすべての種類を使用してください。

$ cat tst.sh
#!/usr/bin/env bash

awk '
    BEGIN {
        split("E20 I47 I49 I50 Q11 R11 W55",tmp)
        for ( i in tmp ) {
            expected[tmp[i]]
        }
    }
    {
        type = substr($0,27,3)
        if ( type in expected ) {
            print type, NR, $0
        }
        else {
            printf "%s[%d]: Unexpected record type \"%s\"\n", FILENAME, FNR, type | "cat>&2"
        }
    }
' "${@:--}" |
sort -k1,1 -k2,2n |
awk '
    $1 != prev {
        close(out)
        out = $1 ".txt"
        prev = $1
    }
    { print $3 > out }
'

$ ./tst.sh myfile.txt

$ head [A-Z]*.txt
==> E20.txt <==
12345678901234567890123456E20XXXXXXXXX
12345678901234567890123456E20XXXXXXXXX
12345678901234567890123456E20XXXXXXXXX

==> I47.txt <==
12345678901234567890123456I47XXXXXXXXX
12345678901234567890123456I47XXXXXXXXX
12345678901234567890123456I47XXXXXXXXX

==> I49.txt <==
12345678901234567890123456I49XXXXXXXXX
12345678901234567890123456I49XXXXXXXXX

==> I50.txt <==
12345678901234567890123456I50XXXXXXXXX
12345678901234567890123456I50XXXXXXXXX

==> Q11.txt <==
12345678901234567890123456Q11XXXXXXXXX
12345678901234567890123456Q11XXXXXXXXX

==> R11.txt <==
12345678901234567890123456R11XXXXXXXXX
12345678901234567890123456R11XXXXXXXXX

==> W55.txt <==
12345678901234567890123456W55XXXXXXXXX
12345678901234567890123456W55XXXXXXXXX
12345678901234567890123456W55XXXXXXXXX

上記で使用されたものDSU（装飾/整列/装飾キャンセル）イディオム繰り返しキーの入力順序を維持しながら、スクリプトを非常に効率的で強力で移植可能にします。

Answer

awkとすべての種類を使用してください。

$ cat tst.sh
#!/usr/bin/env bash

awk '
    BEGIN {
        split("E20 I47 I49 I50 Q11 R11 W55",tmp)
        for ( i in tmp ) {
            expected[tmp[i]]
        }
    }
    {
        type = substr($0,27,3)
        if ( type in expected ) {
            print type, NR, $0
        }
        else {
            printf "%s[%d]: Unexpected record type \"%s\"\n", FILENAME, FNR, type | "cat>&2"
        }
    }
' "${@:--}" |
sort -k1,1 -k2,2n |
awk '
    $1 != prev {
        close(out)
        out = $1 ".txt"
        prev = $1
    }
    { print $3 > out }
'

$ ./tst.sh myfile.txt

$ head [A-Z]*.txt
==> E20.txt <==
12345678901234567890123456E20XXXXXXXXX
12345678901234567890123456E20XXXXXXXXX
12345678901234567890123456E20XXXXXXXXX

==> I47.txt <==
12345678901234567890123456I47XXXXXXXXX
12345678901234567890123456I47XXXXXXXXX
12345678901234567890123456I47XXXXXXXXX

==> I49.txt <==
12345678901234567890123456I49XXXXXXXXX
12345678901234567890123456I49XXXXXXXXX

==> I50.txt <==
12345678901234567890123456I50XXXXXXXXX
12345678901234567890123456I50XXXXXXXXX

==> Q11.txt <==
12345678901234567890123456Q11XXXXXXXXX
12345678901234567890123456Q11XXXXXXXXX

==> R11.txt <==
12345678901234567890123456R11XXXXXXXXX
12345678901234567890123456R11XXXXXXXXX

==> W55.txt <==
12345678901234567890123456W55XXXXXXXXX
12345678901234567890123456W55XXXXXXXXX
12345678901234567890123456W55XXXXXXXXX

上記で使用されたものDSU（装飾/整列/装飾キャンセル）イディオム繰り返しキーの入力順序を維持しながら、スクリプトを非常に効率的で強力で移植可能にします。

Question 3

bash（またはPOSIXシェル）バージョン

#! /bin/sh

exec < "$1"

while read aline
do  key=${aline:26:3}
    case $key in 
    E20|I47|I49|I50|Q11|R11|W55)
        echo $aline >> $key.txt;;
    *)  echo "${0##/} Unexpected record '$key' encounterd" 1>&2;;
    esac
done

次のコマンドを実行します。

sh program-name input-file-name

/bin/sh が使用できない場合は、bash を使用してください。

Answer

bash（またはPOSIXシェル）バージョン

#! /bin/sh

exec < "$1"

while read aline
do  key=${aline:26:3}
    case $key in 
    E20|I47|I49|I50|Q11|R11|W55)
        echo $aline >> $key.txt;;
    *)  echo "${0##/} Unexpected record '$key' encounterd" 1>&2;;
    esac
done

次のコマンドを実行します。

sh program-name input-file-name

/bin/sh が使用できない場合は、bash を使用してください。

レコードタイプ別にレコードを分割し、予期しないレコードタイプを報告します。

答え1

答え2

答え3

関連情報