ファイル内のテキスト行数（区切られていないテキストを含む）を計算する方法はありますか？

Question 1

GNUでは、sed次のことができます。

sed '$=;d'

これは、GNUがsed最後の改行の後の追加の文字を追加の行として扱うためです。ほとんどのGNUユーティリティと同様に、GNUはsed入力時にNUL文字をサポートし、行の長さに制限はありません（どちらの条件もPOSIXに従って入力をテキストではないものにします）。

POSIXlyベース@Inianの答え過度に長い行とNULバイトをサポートします。

LC_ALL=C tr -cs '\n' '[x*]' | awk 'END {print NR}'

このtrコマンドは、改行文字（デコードの問題を避けるために、各バイトはCロケールの文字として解釈されます）を除く1つ以上の文字で構成されるすべてのシーケンスを次に変換します。一つ x文字であるため、awk入力レコードの長さは0または1バイトになり、入力にはx改行文字のみが含まれます。

$ printf '%10000s\na\0b\nc\nd' | wc -l
3

$ printf '%10000s\na\0b\nc\nd' | mawk 'END{print NR}'
2
$ printf '%10000s\na\0b\nc\nd' | busybox awk 'END{print NR}'
5
$ printf '%10000s\na\0b\nc\nd' | gawk 'END{print NR}'
4

$ printf '%10000s\na\0b\nc\nd' | LC_ALL=C tr -cs '\n' '[x*]' | mawk 'END{print NR}'
4

Answer

GNUでは、sed次のことができます。

sed '$=;d'

これは、GNUがsed最後の改行の後の追加の文字を追加の行として扱うためです。ほとんどのGNUユーティリティと同様に、GNUはsed入力時にNUL文字をサポートし、行の長さに制限はありません（どちらの条件もPOSIXに従って入力をテキストではないものにします）。

POSIXlyベース@Inianの答え過度に長い行とNULバイトをサポートします。

LC_ALL=C tr -cs '\n' '[x*]' | awk 'END {print NR}'

このtrコマンドは、改行文字（デコードの問題を避けるために、各バイトはCロケールの文字として解釈されます）を除く1つ以上の文字で構成されるすべてのシーケンスを次に変換します。一つ x文字であるため、awk入力レコードの長さは0または1バイトになり、入力にはx改行文字のみが含まれます。

$ printf '%10000s\na\0b\nc\nd' | wc -l
3

$ printf '%10000s\na\0b\nc\nd' | mawk 'END{print NR}'
2
$ printf '%10000s\na\0b\nc\nd' | busybox awk 'END{print NR}'
5
$ printf '%10000s\na\0b\nc\nd' | gawk 'END{print NR}'
4

$ printf '%10000s\na\0b\nc\nd' | LC_ALL=C tr -cs '\n' '[x*]' | mawk 'END{print NR}'
4

Question 2

これは利用可能であり、ファイルの先頭から現在のレコード数を追跡するawk特別な変数があります。NRこの変数は各行の終わりにインクリメントされます。ブロックに印刷するときEND、つまりすべての入力行を処理した後、最後に処理されたレコードの番号を印刷します。

printf "aa\nbb" | awk 'END { print NR }'
2

printf "aa\nbb\n" | awk 'END { print NR }'
2

Answer

これは利用可能であり、ファイルの先頭から現在のレコード数を追跡するawk特別な変数があります。NRこの変数は各行の終わりにインクリメントされます。ブロックに印刷するときEND、つまりすべての入力行を処理した後、最後に処理されたレコードの番号を印刷します。

printf "aa\nbb" | awk 'END { print NR }'
2

printf "aa\nbb\n" | awk 'END { print NR }'
2

ファイル内のテキスト行数（区切られていないテキストを含む）を計算する方法はありますか？

答え1

答え2

関連情報