著作権記号の削除

著作権記号の削除

コマンドラインからRSSフィードを解析しようとしています。これまでのところ、コードは機能しましたが、フィードに著作権記号が含まれていますが、それを削除しようとしました(latin1でエンコードされています)。 Maybeを使用して著作権記号(\xA9)を削除するにはsed

答え1

これが唯一の問題であれば、@Kevinのコメントに同意します。フィード全体がUTF-8でない場合は、tr -cd SETSETに含まれていないすべての文字を削除するか、iconv -f (encoding) -t utf-8フィードのエンコーディングを知っている場合を検討してください。

答え2

tr -d '©'簡単に削除できます。

文字列に置き換えるには、次を使用できます。

sed 's/©/(c)/g'

関連情報