テキストを削除するためにどのパイプラインが使用されますか?

テキストを削除するためにどのパイプラインが使用されますか?

次の方法でデータをファイルにダウンロードします(コードはValentin Bajramiに提供されています)。

curl https://en.wikipedia.org/wiki/Help:Special_page -s | grep -o 'Special:[a-zA-Z0-9]*' | sort -u > special_page_names

ちょうど正確なマッチングのために使用していますが、実際にはSpecial:データをダウンロードした後にこのSpecial:テキストはあってはなりません。

その後、sortパイプラインで何を削除できますかSpecial:

答え1

他のパイプは必要ありません。この試み:

curl https://en.wikipedia.org/wiki/Help:Special_page -s | grep -oP 'Special:\K[a-zA-Z0-9]*' | sort -u > special_page_names

関連情報