YouTube検索ページを取得しようとしていますが、そこにURLがひどいです。searchkeyword
アップロード日別にソートして検索する場合の例は次のとおりです。
wget http://www.youtube.com/results?search_type=videos&search_query=searchkeyword&search_sort=video_date_uploaded&suggested_categories=26%2C27%2C22%2C28%2C24
検索結果2ページです。
wget http://www.youtube.com/results?search_type=videos&search_query=searchkeyword&search_sort=video_date_uploaded&suggested_categories=26%2C27%2C22%2C28%2C24&page=2
wgetは誤解を招く2つのページを提供します。
答え1
URLを一重引用符で囲むことで問題は解決します。また、ダウンロードしたファイルの名前を指定する必要があります(そうしないと、wget
URLから推測される奇妙な名前を持つことになります)。だから
wget 'http://www.youtube.com/results?search_type=videos&search_query=searchkeyword&search_sort=video_date_uploaded&suggested_categories=26%2C27%2C22%2C28%2C24' -O nice_name.html
laebshadeのコメントに基づいた説明(上記をありがとう):URLの多くの興味深い文字は次のように表示されます。シェル特別なコマンドやその他の制御シーケンスとして。髪の先から、〜! # ^ & *はシェルで異なる意味を持ちます(使用するシェルによって異なります)。\
1つずつエスケープしたり、内容全体を引用したりするために使用できます。
答え2
wget
単一ページのダウンロードには使用しないでください。サイト全体の再帰ダウンロードなどの作業に適しています。試してcurl
みてください。
また?
。
curl 'http://www.youtube.com/results?search_type=videos&search_query=searchkeyword&search_sort=video_date_uploaded&suggested_categories=26%2C27%2C22%2C28%2C24&page=2' \
> results.html
答え3
使用YouTube-DLYouTube 動画のダウンロードに使用されます。これは叙事詩的なPythonスクリプトです。 Pythonが必要です。 Ubuntuがある場合は、次のコマンドを使用してインストールします。sudo apt-get install youtube-dl
それ以外の場合は、Webサイトから直接ダウンロードできます。http://rg3.github.com/youtube-dl/