自動化されたジョブ生成PDFにダウンロード、検索、通知

自動化されたジョブ生成PDFにダウンロード、検索、通知

毎時間特定のURLからPDFをダウンロードし、「6256896」などの一部のテキストを検索し、そのテキストがPDFにある場合は、電子メールなどで通知する自動化されたタスクを作成したいと思います。

プログラミングなしでこれは可能ですか?それではどうでしょうか?

答え1

これを行うにはシェルスクリプトを使用できますが、最小限のコード数行を書く必要があり、実際にはスクリプトなので、通常は端末に入力するコピー/貼り付けコマンドと似ています。ファイルをダウンロードするには、wgetを使用できます。その後、PDFが「きれいに作成された」と仮定すると(たとえば、.texソースファイルから)、pdftotext(Ubuntuのpoppler-utilsパッケージから)などのユーティリティを使用して、ほぼすべてのテキストを抽出でき、簡単に使用できます。 mail コマンドはメールを送信します。毎時間実行するには、スクリプトをcronジョブに設定します。

#!/bin/sh

wget http://some_url.com/file.pdf
if [ pdftotext file.pdf - | grep 'pattern' ]
then
    mail -u your_user@localhost -s "pattern found inside file.pdf!"
fi

関連情報