元のコンテンツ(HTML)を表示せずにWebサイトのコンテンツのみを表示するには?

元のコンテンツ(HTML)を表示せずにWebサイトのコンテンツのみを表示するには?

私はカールを試しましたが、HTMLコンテンツ(ソースコード)がたくさん表示されます。

Webページの内容(例:一部の情報を含む表)を表示できるかどうかを知りたいです。

答え1

あなたが使用できるlinks

例えばlinks -width 512 -dump http://www.example.com/

linksすべてではなくても、ほとんどのLinuxディストリビューションで事前にパッケージ化することができ、ソースコードを含むホームページは次の場所にあります。http://links.twiright.com/

lynx別のオプションであるオプションがある別のテキストモードブラウザです-dump。また、ほとんどの/すべてのLinuxディストリビューション用にパッケージ化されています。ホームページは次のとおりです。http://lynx.invisible-island.net/

答え2

あなたは試すことができますHTML2テキスト。役に立たない場合は、追加情報を提供してください。

答え3

LibreOffice Writerなどでソースコードを開くと、内容と書式を読み取ることができる形式で取得でき、他の形式にエクスポートすることもできます。ただし、スクリプトを作成するには別のソリューションを使用することをお勧めします。

関連情報