テキストファイルの2番目の列の各行に対してゼロ以外の数値を計算します。

テキストファイルの2番目の列の各行に対してゼロ以外の数値を計算します。

次のように、各行の単語がコンマで区切られたテキストファイルがあります。

7022122465,0,\N,,0,2015-09-29 10:48:33
7022597642,0,\N,,0,2015-09-29 10:48:33
7022848906,0,\N,,0,2015-09-29 10:48:33
7022848906,5,\N,,0,2015-09-29 10:48:33
7022848906,55,\N,,0,2015-09-29 10:48:33
.....................................etc

Linux / UNIXでは、orコマンドのみを使用してsed2番目の列のゼロ以外の数値を計算したいと思います。grep

ノート

他のコマンドは使用されません。

cut -d',' -f2 < KAR_UBONA_UBONACT15_20150929_20150930_FEEDBACK.txt | grep -vcw 0

しかし、私はそれを望むのではなく、cutそれを使うべきですgrep

答え1

grepオプションを使用できます-c。以下を使用して、最初のカンマの前のすべての文字と2番目のコンマの後のすべての文字を削除できますsed

sed 's/^[^,]*,//;s/,.*//' < the_file | grep -c -E '[^0]'

編集:このsedコマンドはあなたのコマンドと同じことを行いますので、元のコマンドもcut使用できます。grep

EDIT2:1つのコマンドのみを使用したい場合は、@cuonglm grp回答を使用できます。ただ使いたいなら電話1本最終行数を要約するには、sedラベルに多くの作業を行う必要があります。

sed -E -n '
    s/^[^,]*,[^0,]+,.*/+1/   # replace the lines we are interested in with "+1"
    T delete_line            # if we did not do a substitution right now we jump to "delete_line"
    H                        # we did not jump (so we did the substitution and append the "+1" to the hold space
    : delete_line            # the label, here we do nothing (silently drop the current line)
    $ {                      # on the last line we ...
        s/.*/0/              # replace the whole line with "0"
        G                    # append the hold space (all the "+1" from before")
        s/\n//g              # remove all newlines
        p                    # print the line
    }' < the_file

これで、パイプで接続したり、コマンドを複雑な魔法に置き換えることで数字を集計できるbcと聞いたので、可能になります。psedsedsed

ただ使いたいならプログラム( sed) でも何度も呼び出しても大丈夫です。はるかに簡単です。

sed '/^[^,]*,0,.*/d' < the_file | sed -n '$='

答え2

そしてgrep

grep -c '^[^,]*,[^0]' <file

これは、2番目の列が整数型の場合にのみ機能しますが-0+0より一般的な場合は、次を参照してください。@Stéphane Chazelasの返信

答え3

grep -c '^[^,]*,[-+0-9.]*[1-9]'

12これには、、、、、-10e+12表される01数字を含める必要があります0.0001。しかし、例えば0xFFそうではInfないNaNので、これはまだより正式なものとは異なります。

POSIXLY_CORRECT=1 awk -v n=0 -F , '$2 != 0 {n++}; END{print n}'

入力にこの形式で表示された数字がある場合。

sed唯一の解決策として、次のことができます。

sed '/^[^,]*,[-+0-9]*[1-9]/!d' | sed -n '$='

ただし、1回の呼び出しで解決するには、sed数学を手動で実行する必要があります。

sed -n '
  1{x;s/$/0,:0123456789,0/;x;}
  /^[^,]*,[-+0-9]*[1-9]/ {
    x;:1
    s/^,/1/;s/\(.\),\(.*:.*\1\(,*.\)\)/\3\2/;t1
    s/:/,:/
    x
  }
  ${x;s/,.*//p;}'

関連情報