ウノフLibreOfficeを使用すると、LibreOfficeが変換できるすべてのファイルを変換できます。
これでテキストとしてエクスポートする必要があります。UTF-8文字エンコーディング。
次のコマンドを使用します。
unoconv -f txt -e FilterOptions=76 Foo.docx
Foo.txt
ファイルが生成されますが、エンコードは次のようになります。アメリカ式アスキーそして、文字が正しく表示されません。
私の言葉が正しい場合は、エクスポート-e
フィルタリングオプションを次のように設定するオプションがあります。マニュアルページに記載されています。。私の選択に問題があるのでしょうか?
入出力ファイルの例: