wget
次のコマンドを使用すると、
$ wget \
--recursive \
--no-clobber \
--page-requisites \
--html-extension \
--convert-links \
--restrict-file-names=windows \
--domains grantmlong.com \
--no-parent \
grantmlong.com/teaching/index.html
教授のコンテンツをすべてダウンロードしようとしました。コースページ。何らかの理由で、残りのサイトの画像コンテンツはほとんど正しくダウンロードされていますが、Reveal.js講義スライドはダウンロードされません。
たとえば、自分のローカルコンピュータでに移動して開くと、grantmlong.com/teaching/lectures/
3lecture1.html
番目のスライドが表示されます。
ウェブサイトでの画像を見つけましたhttps://grantmlong.com/teaching/lectures/img/hbr.png
。img
ダウンロードしたローカルフォルダに移動wget
すると
cd grantmlong.com/teaching/lectures/img
ls -1
l10_f0.png
l10_f1.png
l10_f2.png
l10_f3.png
l10_f4.png
l10_f5b.png
l10_f5.png
l10_f6.png
l10_f7.png
l10_p1.png
l10_p2.png
l11_p1.png
l11_p2.png
l11_p3.png
l11_p4.png
l11_p5.png
l11_p6.png
l12_p1.png
l12_p2.png
l5_e1.png
l5_e2.png
l5_e3.png
l5_e4.png
l5_glm.png
l5_logreg.png
l5_p10.png
l5_p11.png
l5_p1a.png
l5_p1b.png
l5_p2.png
l5_p3.png
l5_p4.png
l5_p5.png
l5_p6.png
l5_p7.png
l5_p8.png
l5_p9.png
l5_reg_output_1.png
l5_reg_output_2.png
l5_reg_output_3.png
l5_reg_output_4.png
l5_reg_output.png
l6_accuracy.png
l6_confusion.png
l6_p1.png
l6_precision.png
l6_recall.png
l9_p1.png
l9_p2.png
l9_p3.png
l9_p4.png
l9_t1.png
l9_t2.png
l9_t3.png
l9_t4.png
l9_t5.png
hbr.png
見つけることができる場所はありません。これは、Reveal.jsスライドショーの画像が「ページ必須」と見なされず、含まれていないことを示しますwget
。
これらの画像がダウンロードされたことをどのように確認できますか?また、discover.jsスライドショーの一部の画像は、サードパーティのウェブサイトから入手したものです。瞬間。--domains grantmlong.com
Reveal.jsスライドショーではなく、すべてのページに対してこのオプションをtrueに保ちながら、この外部コンテンツをダウンロードするにはどうすればよいですか?
答え1
答え2
もう少し検索したところ、Reveal.jsスライドショーアーカイブのダウンロード問題に対する(ハッキングされた)解決策が見つかりました。 codimd githubにユーザー「zeigerpuppy」が投稿されました。次の回答:
codimdを使用して作成したスライドショープレゼンテーションのアーカイブを保存する方法を見つけました。 wgetを使用してプレゼンテーションから画像を取得するのに問題があります(画像へのリンクがマークダウンであるため)。
したがって、3段階のプロセスですが、高速でうまく機能します。スライドショーを見せたいとしましょう。https://codimd.server.net/p/S1PIjfhM8#/
wget
ファイルと必須ファイル(.cssと.js)を取得するために使用されます。
- あなたのプレゼンテーションは次のように終了します。
p/S1PIjfhM8.html
`
wget --recursive --no-clobber --page-requisites \ --html-extension --convert-links \ --domains codimd.server.net \ https://codimd.server.net/p/S1PIjfhM8#/
Firefoxプラグインを使用してください。画像の選択
- 保存モードを使用する:
Image_Picka/uploads/${name}${ext}
- ページのすべての画像(.svgを含む)を取得します。
- 画像を
uploads
名前付きフォルダに移動します。
sed
以下を使用して、htmlファイルのリンクを相対リンクに変更する必要があります。`
cd p sed -i .bak 's|/uploads/upload_|../uploads/upload_|g' S1PIjfhM8.html
これにより、オフラインで実行できるスライドショーの完全なコピーを受け取ります。保管目的にも適しています。
codimdプログラムの保存オプションの下にこのような機能が組み込まれていれば良いでしょう
save slides
。
同様のアプローチをとったが、最後のステップ実行を使用しなかったsed
。代わりに、Image Pickaを使用して欠落しているすべての画像をダウンロードし、ローカルアーカイブのディレクトリwget
に配置します。これにより、ほとんどの画像コンテンツがスライドショーに表示されます。grantmlong.com/teaching/lectures/img/
wget
サードパーティサイトのgifは読み込めませんが、ほとんどが審美的に見えます(.gif形式の重要な方程式やグラフはありません)。したがって、最も重要な内容をオフラインで見ることができてうれしいです。