csvkit

CSVパーサーを使用して特定の列に基づいてCSV行を重複排除する
csvkit

CSVパーサーを使用して特定の列に基づいてCSV行を重複排除する

このタスクを検索したところ、次のような古い質問が見つかりました。 指定された列に基づいてCSVから重複エントリを削除する 特定の列に基づいてCSVで一意のレコードを識別する awkしかし、私のデータは複数のネストされた二重引用符を持つ複雑なCSVファイルなので、そうすることはできません。 次のような重複を排除したいとします(単純化された状況)。 Ref,xxx,zzz ref1,"foo, bar, base",qux ref1,"foo, bar, base",bar ref2,aaa,bbb 出力には次のように必要です。 Ref,xxx,zzz r...

Admin

CsvKitを使用してCSV列を切り捨てる
csvkit

CsvKitを使用してCSV列を切り捨てる

CSVKitを使用して列の長さを切り取る方法は? 定義は次のとおりです。 列1:長さ制限なし 2列:<2文字以内> エスケープされた(引用)列と新しい行を正しく処理する必要があります。 たとえば、 First Header,Second Header foo, foo,b foo,bar foo,"bar" foo,"""bar" foo," bar" しなければならない First Header,Second Header foo, foo,b foo,ba foo,ba foo,"""b" foo," b" ...

Admin

bashにcsvkitをインストールする方法
csvkit

bashにcsvkitをインストールする方法

csvformatKusalanandaは以下で使用することをお勧めします。csvkitjq @csv二重引用符なしでcsv形式でフォーマット" 回答jqでjsonを解析する方法。 この答えにはPythonの使用は含まれていないようです。しかし、csvkitインストールチュートリアルそしてそのインストールのトラブルシューティングPythonを使用する必要があるか依存しているようです。これは初心者として私を混乱させました。 Pythonを使用せずにgit bashにcsvkitをインストールできます(例:スパイダーやアナコンダを開くを参照)。どのように? 編集...

Admin

Linux / Bashのこのcsvファイルからこれら2つの列をどのように分離できますか?
csvkit

Linux / Bashのこのcsvファイルからこれら2つの列をどのように分離できますか?

これら2つの列をそれぞれ別々のテキストファイルに分割したいと思います。このデータは、タイタニックの乗客データを含むKaggleのcsvファイルから取得されます。最初の列は乗客の数で、2番目の列は乗客の年齢です。つまり、1歳の子供10人、2歳の子供12人などです。私はそれらを分離してコマンドラインの簡単なチャートに入れたいと思います。これまで、csvkitを使用してデータセットを操作しました。ありがとうございます!私は初めてLinuxに触れ、コミュニティに参加するのは今回が初めてです! 10 1 12 2 7 3 10 4 5 5 6 6 ...

Admin

複数のファイルのヘッダーごとに列を切り捨てるcsvcutスクリプトを作成する方法は?
csvkit

複数のファイルのヘッダーごとに列を切り捨てるcsvcutスクリプトを作成する方法は?

以来csvcut(csvkit)一度に複数のファイルを使用せずに複数のファイルを処理するために使用するには、スクリプトを作成する必要があります。 最初のパラメーターは区切り文字、2番目のパラメーターは抽出する列のヘッダー、残りのパラメーターはファイル名です。 ファイル名が欠落している場合、スクリプトは標準入力になければなりません。 これをする必要があります csvcut ';' Measure calories.csv 私はそれについてあまり慣れていませんcsvkit。誰でも助けることができますか? ...

Admin

CSVフィールドの最大長エラーとquoteing=csv.QUOTE_NONE設定
csvkit

CSVフィールドの最大長エラーとquoteing=csv.QUOTE_NONE設定

csvcutカンマ区切りの.csvファイルで実行した後: [root@server files]# csvcut -c title,mpn,overview,techspecs2,image_carousel_elargesrc syn_multi-image.csv > syn_scraped_cut.csv エラーが発生します。 CSVには最大長の131072文字より長いフィールドが含まれています。 field_size_limitパラメーターを使用して最大値を増やすか、quoteing = csv.QUOTE_NONEを設定してください。 ...

Admin

csvsqlクエリ構文エラーが発生しましたか?
csvkit

csvsqlクエリ構文エラーが発生しましたか?

列の値が「PI Date」のレコードをattributes.csv除いて、すべてのレコードを新しいファイルとして取得したいcsvファイルがあります。attributes_withoutPIDate.csvName csvsqlこのように命令を出す csvsql -d ',' -I --query 'select * where Name <> "PI Date" from attributes' attributes.csv > attributes_withoutPIDate.csv エラー発生 (sqlite3.Operati...

Admin