私は何年もStackexchangeを読んでおり、いつも私が扱うべき質問に対する答えを見つけました。ところで今回は私が今直面している問題に対する解決策が見つからないので質問いたします。
私は現在研究プロジェクトを進めており、ウェブサイト用のサイトマップを作成する必要があります。オンラインフォーラム(現在は存在しません)からダウンロードした10GB以上のPHPファイルがあります。ファイルがすべてフォルダに含まれているため、フォルダに基づいて元の構造を再構成することはできません。
PHPファイルを解析し、ある種のサイトマップ/構造(XML、HTMLなど)を出力するツール/スクリプト(どの言語なのか気にしない)があるかどうか疑問に思います。
このファイルはphpBBを使用して作成されました。私はDebianとUbuntu(2つの異なるPC)を使用しています。どんな提案でも歓迎します。事前にありがとう
答え1
パッケージ:ネットワークチェック
Description-en: ウェブサイトのリンクと構造チェッカー
webcheckはウェブマスターのためのウェブサイト検査ツールです。特定のウェブサイトをクロールし、多くのHTMLページ形式でレポートを生成します。使いやすく、シンプルで明確で読みやすいレポートを生成します。
Features of webcheck include: * support for http, https, ftp and file schemes * view the structure of a site * track down broken links * find potentially outdated and new pages * list links pointing to external sites * can run without user intervention
生成されるレポートの1つはサイトマップです。