この場合、grepが正しく機能しないのはなぜですか？

Question 1

....私は何が間違っていましたか？ ...より複雑にすることに加えて、...すべての場合-24と異なる場合に文字列に含まれていない複数のスペースと先行スペースを一致させようとしています...

P [0-9]+ 24 |

わかりましたP。一連の数字[0-9]+とスペース24を順番に入力します。

| P [0-9] + -24 |

ここの数字の前と後には1つ以上のスペースがあり、その後には余分なスペースがあるため一致しない別のスペースが続きます。P+

|P [0-9][0-9]+ 24 |

もう一度うまくいきますが、すべての一致がすでに最初のパターンでキャプチャされているため、重複しています。

| P [0-9][0-9] + -24 |

追加のスペース、上記と同じ-24...一致しません

|P [0-9][0-9][0-9] + 24 |

以前は空きスペースがあったので、また2つ以上+探してみました。

| P [0-9][0-9][0-9] + -24 |

the の前には先行スペースがあり、再びP2 つ以上のスペースが前に続きます。-24

|P [0-9][0-9][0-9][0-9]+ 24 |

すばらしいが重複

| P [0-9][0-9][0-9][0-9] + -24

the の前には先行スペースがあり、再びP2 つ以上のスペースが前に続きます。-24

@gillesquenotはよりエレガントなソリューションを提供しますが、余分なスペースを失ってもソリューションは「動作」します。

grep -E '(P [0-9]+ 24 |P [0-9]+ -24 |P [0-9][0-9]+ 24 |P [0-9][0-9]+ -24 |P [0-9][0-9][0-9] + 24 |P [0-9][0-9][0-9]+ -24 |P [0-9][0-9][0-9][0-9]+ 24 |P [0-9][0-9][0-9][0-9]+ -24 )'

複数のスペースが利用可能な場合

grep -E '^P +[0-9]+ +-?24'

編集する

これ文字列内の一致内容と位置を確認するのに便利なリソースです。

Answer

....私は何が間違っていましたか？ ...より複雑にすることに加えて、...すべての場合-24と異なる場合に文字列に含まれていない複数のスペースと先行スペースを一致させようとしています...

P [0-9]+ 24 |

わかりましたP。一連の数字[0-9]+とスペース24を順番に入力します。

| P [0-9] + -24 |

ここの数字の前と後には1つ以上のスペースがあり、その後には余分なスペースがあるため一致しない別のスペースが続きます。P+

|P [0-9][0-9]+ 24 |

もう一度うまくいきますが、すべての一致がすでに最初のパターンでキャプチャされているため、重複しています。

| P [0-9][0-9] + -24 |

追加のスペース、上記と同じ-24...一致しません

|P [0-9][0-9][0-9] + 24 |

以前は空きスペースがあったので、また2つ以上+探してみました。

| P [0-9][0-9][0-9] + -24 |

the の前には先行スペースがあり、再びP2 つ以上のスペースが前に続きます。-24

|P [0-9][0-9][0-9][0-9]+ 24 |

すばらしいが重複

| P [0-9][0-9][0-9][0-9] + -24

the の前には先行スペースがあり、再びP2 つ以上のスペースが前に続きます。-24

@gillesquenotはよりエレガントなソリューションを提供しますが、余分なスペースを失ってもソリューションは「動作」します。

grep -E '(P [0-9]+ 24 |P [0-9]+ -24 |P [0-9][0-9]+ 24 |P [0-9][0-9]+ -24 |P [0-9][0-9][0-9] + 24 |P [0-9][0-9][0-9]+ -24 |P [0-9][0-9][0-9][0-9]+ 24 |P [0-9][0-9][0-9][0-9]+ -24 )'

複数のスペースが利用可能な場合

grep -E '^P +[0-9]+ +-?24'

編集する

これ文字列内の一致内容と位置を確認するのに便利なリソースです。

Question 2

ミッションのようです。アッ！これはDSL1: これがすぐにawk行く道です。
シンプルで再利用が可能で、効率的で高速です。

いいえ正規表現:

awk '$1 == "P" && ($3 == "-24" || $3 == "24")' file2.txt

または使用正規表現:

awk '$1 == "P" && $3 ~ /^-?24$/' file2.txt

ここで、正規/^-?24$/表現ではダッシュはオプションなので、この短い文字を使用できます。正規表現。

正規表現の一致は次のとおりです。

節	説明する
`^`	文字列の始まり
`-?`	'-'(オプション(最大の一致))
`24`	「二十四」
`$`	オプションの\nの前と文字列の終わり

_{^{1 最も有名なチャットに質問を}}する

Q：DSLは開発者にとって何を意味しますか？

DSL（ドメイン固有の言語）は、特定のタスクをより簡単にコーディングできるように設計されたコンピュータ言語です。特定のアプリケーションドメインに合わせて調整し、開発者が迅速かつ効率的にコードを書くことができます。 DSLの一般的な用途には、データベースクエリ、テキスト処理、および科学シミュレーションが含まれます。 DSLを使用すると、開発者は特定の目的のためにアプリケーションを迅速に構築し、より直感的なプログラミングアプローチを提供し、構文への依存を減らすことができます。

Answer

ミッションのようです。アッ！これはDSL1: これがすぐにawk行く道です。
シンプルで再利用が可能で、効率的で高速です。

いいえ正規表現:

awk '$1 == "P" && ($3 == "-24" || $3 == "24")' file2.txt

または使用正規表現:

awk '$1 == "P" && $3 ~ /^-?24$/' file2.txt

ここで、正規/^-?24$/表現ではダッシュはオプションなので、この短い文字を使用できます。正規表現。

正規表現の一致は次のとおりです。

節	説明する
`^`	文字列の始まり
`-?`	'-'(オプション(最大の一致))
`24`	「二十四」
`$`	オプションの\nの前と文字列の終わり

_{^{1 最も有名なチャットに質問を}}する

Q：DSLは開発者にとって何を意味しますか？

DSL（ドメイン固有の言語）は、特定のタスクをより簡単にコーディングできるように設計されたコンピュータ言語です。特定のアプリケーションドメインに合わせて調整し、開発者が迅速かつ効率的にコードを書くことができます。 DSLの一般的な用途には、データベースクエリ、テキスト処理、および科学シミュレーションが含まれます。 DSLを使用すると、開発者は特定の目的のためにアプリケーションを迅速に構築し、より直感的なプログラミングアプローチを提供し、構文への依存を減らすことができます。

Question 3

正規表現を少し単純化してみましょう。

grep -E '^P [0-9]+ -?24\b' file2.txt

望ましくない複雑さと可読性に加えて、正規表現の主な問題は、間違った空白をさらに使用することです。

不要：

cat | grepを使用してください。猫の無駄な使用
multiple|regexここで使用してください

入力にさらに多くのスペースがあると思われる場合は、次のいずれかを使用できます。

+
[[:space:]]+(POSIX文字クラス)
\s+-P別名PCREスイッチが必要grep

正規表現の一致は次のとおりです。

節	説明する
`^`	線基準点の始点
`P`	「P」+スペース
`[0-9]+`	すべての文字：「0」〜「9」（1回以上（最大限一致））
	スペース
`-?`	'-'(オプション(最大の一致))
`24`	「二十四」
`\b`	単語の境界

Answer

正規表現を少し単純化してみましょう。

grep -E '^P [0-9]+ -?24\b' file2.txt

望ましくない複雑さと可読性に加えて、正規表現の主な問題は、間違った空白をさらに使用することです。

不要：

cat | grepを使用してください。猫の無駄な使用
multiple|regexここで使用してください

入力にさらに多くのスペースがあると思われる場合は、次のいずれかを使用できます。

+
[[:space:]]+(POSIX文字クラス)
\s+-P別名PCREスイッチが必要grep

正規表現の一致は次のとおりです。

節	説明する
`^`	線基準点の始点
`P`	「P」+スペース
`[0-9]+`	すべての文字：「0」〜「9」（1回以上（最大限一致））
	スペース
`-?`	'-'(オプション(最大の一致))
`24`	「二十四」
`\b`	単語の境界

Question 4

まあ、値が24である可能性がある1つのフィールドにのみ依存しているのです。これは間違った設計のように見えます。たとえば、さらにcut分析するために、そのファイルから最初と3番目の列を抽出するためのツールがたくさんあります。

しかし、正直に言うと、これはまたはsedなどのcut文字列エンジンではなく、表形式の数値データを処理するツールの作業ですgrep。

正直に言うと、数行のPython（またはPerlまたは...必要なプログラミング言語）がこの問題を解決します。とにかく、ここで結果をプログラム的に処理すると100％確信しています。スタート言語から。

簡単に説明すると、次のようになります。

#!/usr/bin/env python3
import sys

with open(sys.argv[1], "r", encoding="ascii") as inputfile:
  linecounter = 0
  for line in inputfile:
    linecounter += 1
    try:
      if not line.startswith("P "):
         continue # skip this line alltogether
      thirdpos = int(line.split(" ")[2])
      if not (thirdpos == 24 or thirdpos == -24):
         continue
      print(line) # or actually, do something useful with the line
    except Exception as e:
      print("Exception occurred on line {linecounter}, '{line}':\n{e}", sys.stderr)

テキストファイルでchmod 755 thatfile、を実行してから/path/to/thatfile /path/to/input_file。

Answer

まあ、値が24である可能性がある1つのフィールドにのみ依存しているのです。これは間違った設計のように見えます。たとえば、さらにcut分析するために、そのファイルから最初と3番目の列を抽出するためのツールがたくさんあります。

しかし、正直に言うと、これはまたはsedなどのcut文字列エンジンではなく、表形式の数値データを処理するツールの作業ですgrep。

正直に言うと、数行のPython（またはPerlまたは...必要なプログラミング言語）がこの問題を解決します。とにかく、ここで結果をプログラム的に処理すると100％確信しています。スタート言語から。

簡単に説明すると、次のようになります。

#!/usr/bin/env python3
import sys

with open(sys.argv[1], "r", encoding="ascii") as inputfile:
  linecounter = 0
  for line in inputfile:
    linecounter += 1
    try:
      if not line.startswith("P "):
         continue # skip this line alltogether
      thirdpos = int(line.split(" ")[2])
      if not (thirdpos == 24 or thirdpos == -24):
         continue
      print(line) # or actually, do something useful with the line
    except Exception as e:
      print("Exception occurred on line {linecounter}, '{line}':\n{e}", sys.stderr)

テキストファイルでchmod 755 thatfile、を実行してから/path/to/thatfile /path/to/input_file。

この場合、grepが正しく機能しないのはなぜですか？

答え1

答え2

正規表現の一致は次のとおりです。

答え3

正規表現を少し単純化してみましょう。

正規表現の一致は次のとおりです。

答え4

関連情報