私は最近このライブラリを見つけましたが、最初の影響はまったく楽しくありませんでした!まず、このホームページからhttps://lxml.de/私はあなたについて知らないが、何も理解していない!とても複雑で混乱しています…勉強しながらすでに知っているようにお話しします!パッケージ化された例は理解しにくく、いくつかの点では非常に表面的な説明が含まれています。そのために、私は2つのことを要求します。
最初:
もし良い資料があるサイトご存知であれば教えていただければ幸いです。
第二:
私の主な目的は、単に解析することですハイパーテキストマークアップ言語(いいえXML)源泉。そのチュートリアル(そして他の多く)で、私はそれらがすべて使用しているのを見ました。木(lxml.etree
)とHTML(lxml.html
)方法... 2つの間にどのような変化がありますか?まだよく理解していないので...
私の英語でありがとう、ごめんなさい
答え1
PythonでHTMLを解析するには、次のようにします。美しいスープ`代わりに。 HTMLは正しく機能する形式ではなく、XMLパーサーを使用することはうまくいかない可能性があります。