Azure Machine Learning では、CSV ファイルの区切り文字としてセミコロンの代わりにコンマを使用する必要があります。これにより、セミコロンを使用し、セル値にカンマが多い* ixコンピュータでは多くの問題が発生します。
文字をエスケープしたり、セル内のすべてのコンマを置き換える正しい方法は何ですか?このフォーマットの問題と可能な変換を防ぐか、または助けることができるUnixツールはありますか?
答え1
フィールドにコンマがある場合、結果のCSVファイルはフィールドを対応するコンマと区別する方法を生成する必要があります。たとえば、これは通常、次のフィールドの周りに引用符を配置することによって行われます。
"field,1","field,2"
それ以外の場合は、フィールドとフィールドの一部の違いを区別する方法はありません。どの役割を選択しても、この問題は存在します。
必要に応じて、上記の例のように、これらの項目を検索して自分の役割に置き換えることができます。
sed -e 's/","/"~"/g' csvfile