
毎日いくつかの項目を追加する大容量CSVファイルがあります(常にこのファイルに書き込んで分割できない外部ソフトウェアで作成されます)。パフォーマンス上の理由と追加処理のために新しいデータだけを読みたいです。これらのタスクに役立つファイルから読み取る開始オフセットを定義するためのコマンドラインツールはありますか?
答え1
tail -c +N filename
(ここでは整数)は、N
最初のバイトをN-1
除くすべてを印刷しますfilename
(つまり、-c +1
ファイル全体を印刷します)。もちろん、最後の実行のファイルサイズを追跡する必要があります。