私はbusyboxツールを使用しており、Webページのすべてのhttpリンクを取得したいと思います。サンプルリンクページを保存するには、カールまたはwgetを使用します。ただし、ページをhtmlとして保存します。カールまたはwgetコマンドを使用してこれをどのように実行できますか?
example webpage = http://www.turanevdekorasyon.com/wp-includes/test/
次のデータは Firefox ブラウザを使用してテキスト形式で保存されます。
Index of /wp-includes/test/
Name <http://www.turanevdekorasyon.com/wp-includes/test/?ND> Last modified <http://www.turanevdekorasyon.com/wp-includes/test/?MA> Size <http://www.turanevdekorasyon.com/wp-includes/test/?SA> Description <http://www.turanevdekorasyon.com/wp-includes/test/?DA>
------------------------------------------------------------------------
up Parent Directory <http://www.turanevdekorasyon.com/wp-includes/> 28-May-2019 02:15 -
[CMP] v1.0.zip <http://www.turanevdekorasyon.com/wp-includes/test/v1.0.zip> 28-May-2019 02:15 4k
[CMP] v1.1.zip <http://www.turanevdekorasyon.com/wp-includes/test/v1.1.zip> 28-May-2019 02:15 4k
[CMP] v1.2.zip <http://www.turanevdekorasyon.com/wp-includes/test/v1.2.zip> 28-May-2019 02:15 4k
------------------------------------------------------------------------
Proudly Served by LiteSpeed Web Server at www.turanevdekorasyon.com Port 80
答え1
使用することをお勧めします Fエリー|保存ㅏChromiumの機能とWebページの保存MHT形式実験的な「ページをMHTMLとして保存」オプションをオンにした後、Chromeブラウザの「chrome://flags/#save-page-as-mhtml」リンクにアクセスしてください。
答え2
使用のポイントは何ですかカールまたは得る?使用サルク:
lynx -dump 'www.example.com'
表示リンクと非表示リンクの両方が出力されます。