
私はwgetを使用して制御できないWebサーバーからディレクトリ構造をコピーしています。私はこのWebページの各リソースの内容に興味がなく、Webサーバーの構造を反映するためのディレクトリとファイルを作成したいだけです。デフォルトでは、できるだけ空のファイルが多数含まれている多くのディレクトリを作成します(ファイルあたり数バイトは問題ではありません)。
wgetを使用してこれを実行できますか?
答え1
回避策を使用して解決しました。イメージを使用して1つの端末からwgetを介してダウンロードし、2番目の端末でこのonelinerを実行します。
while true ; do date; time find /tmp/test/ -type f -exec cp /dev/null {} \; ; sleep 36000; done
これにより、既存のファイルがすべて消去され、10時間一時停止して再実行されます。私の目的には「十分」です。
答え2
wget
--mirrorのマニュアルページによると、あなたが探しているものは次のとおりです。
--mirror
Turn on options suitable for mirroring. This option turns on
recursion and time-stamping, sets infinite recursion depth and
keeps FTP directory listings. It is currently equivalent to -r -N
-l inf --no-remove-listing.
答え3
このようなものはあなたに効果がありますか?
wget --spider -r --no-parent http://your.url.com/
答え4
私も同じ問題があります。wget -O - 'URL'
これにより、空のファイルが自動的に削除され、問題が解決します。
wget -O - 'http://www.google.com'
-O
出力ファイルのダウンロード-
このファイルを削除