awk:コードが部分文字列を収集する方法

awk:コードが部分文字列を収集する方法

一般的な質問でなくてもご了承ください。 n番目のフィールド区切り文字の前にある部分文字列を取得するコードを使用しています。

echo '123-321-333-111-235'| awk -F"-" '
BEGIN {n=3}
{for(i=1;i<=n;++i)  
k = k (k=="" ? "" : FS) $i; 
print(k) 
}'

これは

123-321-333

この行がどのように機能するのかわかりませんk = k (k=="" ? "" : FS) $i;。私を混乱させるのはk=k三項演算子の周りの部分です。$i私の質問は単に説明を聞くことです。

答え1

echo '123-321-333-111-235' |
awk -F'-' -v n=3 '
  {
     for( i=1; i<=n; ++i )
        k = k (k == "" ? "" : FS) $i
     ;
     print k
  }
'

ループをfor3回実行します。

i=1:

 k is empty, $i -> $1 -> 123

 k <= empty ( empty == empty ? empty : "-" ) 123

 k <= empty empty 123

 k <= "123"

i=2:

 k is "123", $i -> $2 -> 321

 k <= "123" ( 123 == empty ? empty : "-" ) 321

 k <= "123" "-" "321"

 k <= "123-321" due to the implicit concatenation property of awk strings

i=3:

 k is "123-321", $i -> $3 -> 333

 k <= "123-321" ( 123-321 == empty ? empty : "-" ) 333

 k <= "123-321" "-" "333"

 k <= "123-321-333"

 This value of k is now sent to stdout.
 STOP.

または、次のことができます。

n=3

echo '123-321-333-111-235' | sed -ne "s/-/\n/$n;P"

echo '123-321-333-111-235' | perl -F- -lane "\$, = '-'; print @F[0..$n-1]"

( 
   var='123-321-333-111-235'
   set -f; IFS='-'; set -- $var

   for((i=1;i<=$n;i++))
   do
      v=${v-}${v:+"$IFS"}$1
   done
   echo "$v"

   # or, alternatively:
   N=$#
   while case $# in `expr $N - $n` ) break ;; esac; do
     V=${V-}${V:+"$IFS"}$1
     shift
   done
   echo "$V"
)

var='123-321-333-111-235'
FS='-'; # field separator provided here
fields=$(yes "[^$FS]*$FS" | head -n $n | tr -d '\n')
result=`expr "$var$FS" : "\($fields\)"`
echo "${result%?}"

答え2

そのエントリがある場合、k = k $i現在処理されている各反復フィールドの末尾に追加されますk(したがって123321333が得られます)。

ある場合はk = k FS $i-123-321-333を受け取ります。

awkが$ 1を処理するとkが空であるため、三項ifは最初にダッシュがないことを確認するため、三項ifは ""を返します。

関連情報