我有一個內部網站,會在日常基礎上發佈最新的統計數據。 這個網站有關於許多公司的信息。我需要獲得一家公司的數據。 HTML代碼如下:Python:從網頁獲取乘文本值
注:所有文本值,如「Big Company A」,「1810」,「14」,「2045」,「135」,「98.8%」,「100.0% 「都需要輸出。
* 注2:在同一頁面有很多公司列表,它們都具有相同的結構。對我來說問題是,如何找到「大公司A」,並輸出屬於大公司A的所有文本值?
<TH class=Company><A href="?scope=1&values=1&deleg=35">Big Company A</A></TH>
<TD>1810</TD>
<TD>14</TD>
<TD>2045</TD>
<TD>135</TD>
<TD class=ok><A class=ok href="av_report.php?deleg=35&dc=%&ou=%&bu=%&site=%">99.8%</A></TD>
<TD class=ok><A class=ok href="av_report.php?deleg=35&dc=%&ou=%&bu=%&site=%">100.0%</A></TD>
<TD class=ok><A class=ok href="hips_report.php?deleg=35&dc=%&ou=%&bu=%&site=%">100.0%</A></TD>
<TD class=ok><A class=ok href="hips_report.php?deleg=35&dc=%&ou=%&bu=%&site=%">98.8%</A></TD>
<TD class=ok><A class=ok href="os_reportbyou.php?deleg=35&dc=%&ou=%&bu=%&site=%&server=0&counts=1">100.0%</A></TD>
<TD class=ok><A class=ok href="os_reportbyou.php?deleg=35&dc=%&ou=%&bu=%&site=%&server=1&counts=1">100.0%</A></TD>
<TD class=ok><A class=ok href="pa_reportbydelegs.php?deleg=35&dc=%&ou=%&bu=%&site=%">95.7%</A></TD>
<TD class=ok><A class=ok href="pa_reportbydelegs.php?deleg=35&dc=%&ou=%&bu=%&site=%">97.6%</A></TD>
<TD class=ok><A class=ok href="pa_reportbydelegs4.php?deleg=35&dc=%&ou=%&bu=%&site=%">104.8%</A></TD>
<TD class=ok><A class=ok href="pa_reportbydelegs4.php?deleg=35&dc=%&ou=%&bu=%&site=%">104.2%</A></TD>
<TD class=ok><A class=ok href="pa_reportbydelegs4.php?deleg=35&dc=%&ou=%&bu=%&site=%">99.9%</A></TD>
很抱歉,我沒有Python和HTML,感謝您的幫助很多知識提前
編輯注 @ 2014/04/01追加一個評論關於如何定位「大公司A」
看一看美麗的湯。 – rlms
感謝您的指導,我檢查了BeautifulSoup,並且我認爲我需要花更多時間來了解HTML和Python –