sedを使用して、2つのアルファベット文字を含む行のみを見つけて維持します。

Question 1

sed -ne's/[[:alpha:]]//3;t' -e's//&/2p'  <in >out

... 1行のクラスの3番目の文字をs///置き換えます。[[:alpha:]]その後、t交換が成功したことを確認し、成功するとスクリプトから分岐します。

sed自動的に印刷するように指示されたので、-n3つ以上のアルファベット文字を含む入力行が出力から効果的に削除され、2番目の置換ステートメントによってs///残される唯一の入力行は、2つ以下のアルファベット文字を含む行です。

2番目の置換は//左側の空の正規表現を使用しますsed。(より効率的)最近コンパイルされたものを参照/regexp/- だからs/[[:alpha:]]/...もう一度読むことができます。これはs///、1行目から2番目に現れるアルファベット文字を&それ自体に置き換えようとするため、効果的なno-opが発生し、行は実際には変更されません。ただし、これが正常に実行されると、その行も出力pに印刷されます。

要約すると、最初のs///置換は3つ以上のアルファベット文字に一致するすべての入力行を出力から効果的に削除し、2番目の置換は残りをp2つのアルファベット文字に一致する入力行のみを出力します。

...と/ grep...

grep -xE '([0-9]*[[:alpha:]]){2}' <in >out

声明は要求どおりに正確に従いません。入力では、英数字のみで構成される行のみを選択し、そのサブセット内の2文字以下の一致行のみを選択します。ここで、2番目の文字は最後の文字でなければなりません。このステートメントは、サンプル入力からサンプルに必要な出力を生成します。

ただし、要求されたとおりに実行してください。

grep -xE '([^[:alpha:]]*[[:alpha:]]){2}[^[:alpha:]]*'

このステートメントは、入力行の任意の場所にあり、^アルファベット以外の文字で区切ることができる2つのアルファベット文字に一致する入力行を選択します。

grepスイッチ-xは両方の場合に使用されます。ただし、^行開始アンカーと$行末アンカーが正規表現にそれぞれ追加（前に追加）されている場合は、2つのステートメントのいずれかを省略できます。この-xスイッチは全体的に一致 - したがって、正規表現は一致するすべての入力行を最初から最後まで完全に記述する必要があります。

Answer

sed -ne's/[[:alpha:]]//3;t' -e's//&/2p'  <in >out

... 1行のクラスの3番目の文字をs///置き換えます。[[:alpha:]]その後、t交換が成功したことを確認し、成功するとスクリプトから分岐します。

sed自動的に印刷するように指示されたので、-n3つ以上のアルファベット文字を含む入力行が出力から効果的に削除され、2番目の置換ステートメントによってs///残される唯一の入力行は、2つ以下のアルファベット文字を含む行です。

2番目の置換は//左側の空の正規表現を使用しますsed。(より効率的)最近コンパイルされたものを参照/regexp/- だからs/[[:alpha:]]/...もう一度読むことができます。これはs///、1行目から2番目に現れるアルファベット文字を&それ自体に置き換えようとするため、効果的なno-opが発生し、行は実際には変更されません。ただし、これが正常に実行されると、その行も出力pに印刷されます。

要約すると、最初のs///置換は3つ以上のアルファベット文字に一致するすべての入力行を出力から効果的に削除し、2番目の置換は残りをp2つのアルファベット文字に一致する入力行のみを出力します。

...と/ grep...

grep -xE '([0-9]*[[:alpha:]]){2}' <in >out

声明は要求どおりに正確に従いません。入力では、英数字のみで構成される行のみを選択し、そのサブセット内の2文字以下の一致行のみを選択します。ここで、2番目の文字は最後の文字でなければなりません。このステートメントは、サンプル入力からサンプルに必要な出力を生成します。

ただし、要求されたとおりに実行してください。

grep -xE '([^[:alpha:]]*[[:alpha:]]){2}[^[:alpha:]]*'

このステートメントは、入力行の任意の場所にあり、^アルファベット以外の文字で区切ることができる2つのアルファベット文字に一致する入力行を選択します。

grepスイッチ-xは両方の場合に使用されます。ただし、^行開始アンカーと$行末アンカーが正規表現にそれぞれ追加（前に追加）されている場合は、2つのステートメントのいずれかを省略できます。この-xスイッチは全体的に一致 - したがって、正規表現は一致するすべての入力行を最初から最後まで完全に記述する必要があります。

Question 2

私は以下を使用しますperl：

perl -ne 'print if length s/\d//gr == 2'

以下を使用します。

-n暗黙のラッピングwhile ( <> ) {ループ
s///r元のテキストを変更せずに置き換えられたテキストを返します。
したがって、すべての数字を削除してから文字列の長さを見てみましょう。
2の場合は、行を印刷します。

注：これにより、行から数字が削除され、数字以外の数字が残ります。代わりにこれを使用できます[^A-Z]。

または - より明確な場合：

perl -ne 'print if (()=m/([A-Z])/g) == 2'

これはperlこのフラグをサポートしていない以前のバージョンで機能しますr。正規表現一致を使用してテキストを選択し、配列要素（一致）の数を計算します。 2の場合は、行を印刷します。

Answer

私は以下を使用しますperl：

perl -ne 'print if length s/\d//gr == 2'

以下を使用します。

-n暗黙のラッピングwhile ( <> ) {ループ
s///r元のテキストを変更せずに置き換えられたテキストを返します。
したがって、すべての数字を削除してから文字列の長さを見てみましょう。
2の場合は、行を印刷します。

注：これにより、行から数字が削除され、数字以外の数字が残ります。代わりにこれを使用できます[^A-Z]。

または - より明確な場合：

perl -ne 'print if (()=m/([A-Z])/g) == 2'

これはperlこのフラグをサポートしていない以前のバージョンで機能しますr。正規表現一致を使用してテキストを選択し、配列要素（一致）の数を計算します。 2の場合は、行を印刷します。

Question 3

ちょうどあなたが望むものを正確に実行する簡単なPythonスクリプトを書いて、あなたの入力をテストしたところ、うまくいきます。

   #!/usr/bin/python

   def count_letters(input):
     count=0
     for char in input:
       if char.isalpha():
         count += 1
     return count

  fh=open('test_input','r')
  for line in fh.readlines():
    if count_letters(line) == 2 :
      print line

Answer

ちょうどあなたが望むものを正確に実行する簡単なPythonスクリプトを書いて、あなたの入力をテストしたところ、うまくいきます。

   #!/usr/bin/python

   def count_letters(input):
     count=0
     for char in input:
       if char.isalpha():
         count += 1
     return count

  fh=open('test_input','r')
  for line in fh.readlines():
    if count_letters(line) == 2 :
      print line

Question 4

そしてawk

awk '{x=$0; gsub(/[^[:alpha:]]/, "", x)};length(x) == 2' file

これにより、各行を変数に設定し、xその中のアルファベット以外のすべての文字を空の文字列に置き換えます。x変更された長さが次xの場合、2関連する行が適しています。

またはgrep

grep '^[^[:alpha:]]*[:[:alpha:]][^[:alpha:]]*[:[:alpha:]][^[:alpha:]]*$' file

Answer

そしてawk

awk '{x=$0; gsub(/[^[:alpha:]]/, "", x)};length(x) == 2' file

これにより、各行を変数に設定し、xその中のアルファベット以外のすべての文字を空の文字列に置き換えます。x変更された長さが次xの場合、2関連する行が適しています。

またはgrep

grep '^[^[:alpha:]]*[:[:alpha:]][^[:alpha:]]*[:[:alpha:]][^[:alpha:]]*$' file

sedを使用して、2つのアルファベット文字を含む行のみを見つけて維持します。

答え1

答え2

答え3

答え4

関連情報