HTMLファイルから値を抽出する

HTMLファイルから値を抽出する

2つのHTMLファイルがあり、そのいくつかは次のとおりです。

ファイル1から:

<td width="48%" align="right" valign="top">
<b>mom. Wirkleistung P+ tot.: </b><br>
<b>mom. Wirkleistung P+ L1: </b><br>
<b>mom. Wirkleistung P+ L2: </b><br>
<b>mom. Wirkleistung P+ L3: </b><br>
</td><td width="4%" align="middle">
&nbsp;
</td><td width="48%" valign="top">
<b>114,00 W </b><br>
<b>  2,00 W </b><br>
<b>109,00 W </b><br>
<b>  2,00 W </b><br>
</td></tr></table>
<p></td>

ファイル2から:

<b>mom. Wirkleistung P- tot.: </b><br>
<b>mom. Wirkleistung P- L1: </b><br>
<b>mom. Wirkleistung P- L2: </b><br>
<b>mom. Wirkleistung P- L3: </b><br>
</td><td width="4%" align="middle">
&nbsp;
</td><td width="48%" valign="top">
<b>  45,00 W </b><br>
<b>  0,00 W </b><br>
<b>  0,00 W </b><br>
<b>  0,00 W </b><br>
</td></tr></table>

両方のファイルに最初のワット値(114.00と45.00、もちろん5秒ごとに変更)を使用して合計を合計したいと思います。

私はRASPBERRY PI(Debian Linuxを実行)を使用していますが、両方のファイルからこの値を抽出して一緒に追加して、5.00、66.70、または1444.24の値が含まれていても機能する方法はありますか?

全文書の下に添付…

<html><head>
<title>FacilityWeb</title>
<meta http-equiv="cache-control" content="no-cache">
<style type="text/css">
#idHF  {font-family:Arial; font-size:30px; color:#FFFFFF }
a      {font-family:Arial; font-size:20px; color:#FFFFFF }
table  {font-family:Arial; font-size:20px; color:#FFFFFF }
input  {font-family:Arial; font-size:20px; font-weight:bold; color:#000000 }
select {font-family:Arial; font-size:20px; font-weight:bold; color:#000000 }
</style>
</head>
<body bgcolor="#000000" link=#ffffff vlink=#ffffff alink=#ffffff>

<table align="center" border="0" width="960" cellspacing="0" cellpadding="8">
<tr><td id="idHF" align="right" valign="middle" bgcolor="#0074B2">
<b><i>Lingg &amp; Janke&nbsp;</i></b></td></tr></table>

<p><table align="center" border="0" width="960" bgcolor="#2f2f2f"><tr>

<!-- BCU part begin -->

<td align="center">
<a href="valpap">[ LEISTUNG P+ ]</a> <a href="valpan">[ LEISTUNG P- ]</a>
<a href="valprp">[ LEISTUNG Q+ ]</a> <a href="valprn">[ LEISTUNG Q- ]</a><br>
<a href="valv">[ SPANNUNG ]</a> <a href="valc">[ STROM ]</a>
<a href="valx">[ COS PHI ]</a><br>
<a href="valpapt">[ GRENZWERTE P+ tot. ]</a><br><a href="valpap1">[ GRENZWERTE P+ L1 ]</a>
<a href="valpap2">[ GRENZWERTE P+ L2 ]</a> <a href="valpap3">[ GRENZWERTE P+ L3 ]</a><br>
<a href="/1.1.2/">[ HOME ]</a>
<p><b>Wirkleistungen P+ (Bezug)</b><p>
<table width="100%"><tr>
<td width="48%" align="right" valign="top">
<b>mom. Wirkleistung P+ tot.: </b><br>
<b>mom. Wirkleistung P+ L1: </b><br>
<b>mom. Wirkleistung P+ L2: </b><br>
<b>mom. Wirkleistung P+ L3: </b><br>
</td><td width="4%" align="middle">
&nbsp;
</td><td width="48%" valign="top">
<b> 70,00 W </b><br>
<b>  2,00 W </b><br>
<b> 64,00 W </b><br>
<b>  2,00 W </b><br>
</td></tr></table>
<p></td>

<!-- BCU part end -->

</tr></table><p>

<table align="center" border="0" width="960" cellspacing="0" cellpadding="8">
<tr><td align="center" valign="middle" bgcolor="#0074B2">
<a id="idHF" href="/en/main.htm"><b>HOME</b></a></td></tr></table>

</body></html>

答え1

入力ファイルがそれぞれa.txtとb.txtであるとします。

sed -e 's/<[^>]*>//g' -e s/,/./ a.txt|awk '/W/ { s+=$1 } END { print s }'
227

sed -e 's/<[^>]*>//g' -e s/,/./ b.txt|awk '/W/ { s+=$1 } END { print s }'
45

0,12 Wこれは、10進データ(たとえば、指定されたもの)を使用しても機能します45.12

常に10進データが必要な場合

sed -e 's/<[^>]*>//g' -e s/,/./ a.txt|awk  '/W/ { s+=$1 } END { printf "%.2f\n", s }'
227.00

編集する: 最初の値のみを取得するには($2はWで$1を印刷します)

sed -e 's/<[^>]*>//g' -e s/,/./ a.txt|awk '/W/ { print $1 ; exit ;  }'

編集2:完全なログを使用してWと一貫性を維持しようとしています。

sed -e 's/<[^>]*>//g' -e s/,/./ a.txt|awk '$2 == "W" { print $1 ; exit ;  }'
70.00

編集3:2つの値を追加します。

最も簡単な方法は、bash機能を使用して数値を追加することです。

ファイルが files1.html と files2.html にあるとしましょう。

VAR1=$(sed -e 's/<[^>]*>//g' -e s/,/./ files1.html |awk '$2 == "W" { print $1 ; exit ;  }' )
VAR2=$(sed -e 's/<[^>]*>//g' -e s/,/./ files2.html |awk '$2 == "W" { print $1 ; exit ;  }' )
SUM=$(($VAR1 + $VAR2))

関連情報