HTMLからテキストを抽出する

HTMLからテキストを抽出する

私は持っていますこのページ。 HTMLページから、特にテーブルタイトル(th)とテーブルデータ()のテキストを抽出したいと思いますtd。たとえば、

国:アメリカ(US)注: カリフォルニアここでth= 国とtd= 米国 (US)。

これは、以下を使用して取得できる最も近い結果ですxidel

xidel -A  "Mozilla/5.0" http://www.ip-tracker.org/locator/ip-lookup.php ip=8.8.8.8 -e 'th[1] td[1]'

HTMLページからすべての項目thとテーブル項目を抽出する方法は?td

関連情報