
コマンドラインからRSSフィードを解析しようとしています。これまでのところ、コードは機能しましたが、フィードに著作権記号が含まれていますが、それを削除しようとしました(latin1でエンコードされています)。 Maybeを使用して著作権記号(\xA9
)を削除するにはsed
?
答え1
これが唯一の問題であれば、@Kevinのコメントに同意します。フィード全体がUTF-8でない場合は、tr -cd SET
SETに含まれていないすべての文字を削除するか、iconv -f (encoding) -t utf-8
フィードのエンコーディングを知っている場合を検討してください。
答え2
tr -d '©'
簡単に削除できます。
文字列に置き換えるには、次を使用できます。
sed 's/©/(c)/g'