これが私が今まで持っているものです:
- Webブラウザが起動しているときに実行される
- 現在のWebページのすべてのコンテンツをダウンロードして「興味のあるコンテンツ」を検索してください。
- 上記「関心コンテンツ」の出力サマリー/詳細
ただし、この出力は画面上のファイルにのみ入れることができます。これは私がcliに完全に保管しておいたものであり、おそらくこれが私が余裕があるすべてだと信じています。私は間違っていますか?
拡張/追加機能のようにブラウザと対話できるようにしたいです。私のプロジェクトをモデル化するために使用できる既知の方法やパスは何ですか?
答え1
私はこのためにbashを使用しませんが、一部のブラウザコントロールは(追加)JavaScriptを使用してページを拡張することで実行でき、bashはそれと通信できます。
そのようなWebブラウザドライバを最初から開発すること(そしてすでにやったよりJavaScriptをより深く探求したくない)ではなくセレンそして、所定のディレクトリにあるファイルからコマンドを読み取るカスタムプログラム(私の場合はPython)があります。これらのコマンドは、他のプログラム(bash、Pythonなど)で作成されたテキストファイルで、単一のジョブと繰り返しのジョブ、他のジョブがスケジュールされていない場合はバックグラウンドジョブをスケジュールできます。新しく予期しない作業の場合は、カスタムプログラムを調整してWebブラウザを再起動する必要がありますが、初期開発段階の後にはこれらの拡張はほとんど必要ありません。