私は持っていますこのページ。 HTMLページから、特にテーブルタイトル(th
)とテーブルデータ()のテキストを抽出したいと思いますtd
。たとえば、
国:アメリカ(US)、注: カリフォルニアここでth
= 国とtd
= 米国 (US)。
これは、以下を使用して取得できる最も近い結果ですxidel
。
xidel -A "Mozilla/5.0" http://www.ip-tracker.org/locator/ip-lookup.php ip=8.8.8.8 -e 'th[1] td[1]'
HTMLページからすべての項目th
とテーブル項目を抽出する方法は?td