Wayback Machine(archive.org)の次のページには、URLにアスタリスク*があります。 https://web.archive.org/web/*/https://www.nasa.gov/
CURLまたはwgetの両方がページを掻き取ることを許可しません。私は最新バージョンのLinux Mint(2018)を使用しています。
PHPでwgetまたはCURLを使用してURLにアスタリスク*を持つWebページのスナップショットを取得する方法、具体的にhttps://web.archive.org/web/*/https://www.nasa.gov/?
ありがとうございます! httrackは動作しますか?
編集:ウェブサイトweb.archive.org/web/%2A/を開きます。https://www.nasa.govブラウザから。次に、wgetコマンドを使用して見たものと比較します。彼らは同じですか?私にとって、wgetコマンドは通常のページを返します。
答え1
URLを引用符で囲むと大丈夫そうです。
「警告:ワイルドカード文字はHTTPではサポートされていません」というメッセージを避けるための最も簡単な方法は、アスタリスクをアスタリスクに置き換えることです。パーセントエンコードされた等価物:
wget "https://web.archive.org/web/%2A/https://www.nasa.gov"