Webページの完全なデータを取得する

2024-6-2 • tag-icon

私はbusyboxツールを使用しており、Webページのすべてのhttpリンクを取得したいと思います。サンプルリンクページを保存するには、カールまたはwgetを使用します。ただし、ページをhtmlとして保存します。カールまたはwgetコマンドを使用してこれをどのように実行できますか？

example webpage = http://www.turanevdekorasyon.com/wp-includes/test/

次のデータは Firefox ブラウザを使用してテキスト形式で保存されます。

Index of /wp-includes/test/

Name <http://www.turanevdekorasyon.com/wp-includes/test/?ND>                                                                             Last modified <http://www.turanevdekorasyon.com/wp-includes/test/?MA>         Size <http://www.turanevdekorasyon.com/wp-includes/test/?SA>  Description  <http://www.turanevdekorasyon.com/wp-includes/test/?DA>

------------------------------------------------------------------------
up Parent Directory <http://www.turanevdekorasyon.com/wp-includes/>                                                                 28-May-2019 02:15        -       
[CMP] v1.0.zip <http://www.turanevdekorasyon.com/wp-includes/test/v1.0.zip>                                                                         28-May-2019 02:15       4k       
[CMP] v1.1.zip <http://www.turanevdekorasyon.com/wp-includes/test/v1.1.zip>                                                                         28-May-2019 02:15       4k       
[CMP] v1.2.zip <http://www.turanevdekorasyon.com/wp-includes/test/v1.2.zip>                                                                         28-May-2019 02:15       4k       

------------------------------------------------------------------------
Proudly Served by LiteSpeed Web Server at www.turanevdekorasyon.com Port 80

答え1

使用することをお勧めします Fエリー|保存ㅏChromiumの機能とWebページの保存MHT形式実験的な「ページをMHTMLとして保存」オプションをオンにした後、Chromeブラウザの「chrome://flags/#save-page-as-mhtml」リンクにアクセスしてください。

答え2

使用のポイントは何ですかカールまたは得る？使用サルク:

lynx -dump 'www.example.com'

表示リンクと非表示リンクの両方が出力されます。

答え1

答え2

関連情報