*.txt
何千行ものファイルから特定の範囲のテキスト(文字17〜63など)を繰り返し切り取りたいと思います。
1行は次のとおりです。
<script>addRow("monatswerte_RR_00002_19140101_20061231_hist.zip","monatswerte_RR_00002_19140101_20061231_hist.zip",0,"12.3 kB","8/11/15, 5:18:00 PM");</script>
誰でも次の方法を提案できますか?
私。このテキスト範囲を切り捨てますか?
2. 別の公開文字列に追加しますか?
修正する:
awk -F\" '{print $2}' all-files.txt > output.txt
私に.txt
名前を付けoutput.txt
ました。
awk '{print "ftp://ftp-server.etc..." $0;}' output.txt > list.txt
Webスクレイピングに必要な最終ファイル名のリストを生成します。
答え1
私の最初の考えはJeff Schallerの考えと同じでしたcut -c 17-64
。しかし、これには終値が含まれているのでcut -c 17-63
最初の引用語が必要ですが、すべての単語の長さが同じでない場合は、awkを使用できます。awk -F\" '{print $2}' file.txt