次の方法でデータをファイルにダウンロードします(コードはValentin Bajramiに提供されています)。
curl https://en.wikipedia.org/wiki/Help:Special_page -s | grep -o 'Special:[a-zA-Z0-9]*' | sort -u > special_page_names
ちょうど正確なマッチングのために使用していますが、実際にはSpecial:
データをダウンロードした後にこのSpecial:
テキストはあってはなりません。
その後、sort
パイプラインで何を削除できますかSpecial:
?
答え1
他のパイプは必要ありません。この試み:
curl https://en.wikipedia.org/wiki/Help:Special_page -s | grep -oP 'Special:\K[a-zA-Z0-9]*' | sort -u > special_page_names