我知道我的問題有很多主題,但我找不到有用的解決方案,我的答案。我可以連接到網站並逐行閱讀Java,現在這是我的問題。我想從html頁面解析特定的信息。此頁面包括5天的天氣預報。例如預測標籤的日期是這樣的;我如何使用Java解析來自html源代碼的特定信息
//date of forecast
< th id="ctl00_mpBody_thmGun1" class="arkaTrh">19 April</th>
//Min weather:
< td id="ctl00_mpBody_thmMin1" class="minS">8< /td>
//Max weather
< td id="ctl00_mpBody_thmMax1" class="maxS">17< /td>
second day and others tags continue like this,
< th id="ctl00_mpBody_thmGun2" class="arkaTrh">20 April</th>
.
.
.
根據這些標籤,我需要解析17年4月19日和8
我忘了寫,我需要通過使用正則表達式:) – 2011-04-18 18:35:39
http://download.oracle.com/javase/tutorial/essential/regex/index.html /class = \「arkaTrh \」>([0-9a- zA-Z] +)/ – Gerben 2011-04-18 18:41:42
使用正則表達式解析HTML之前請仔細考慮。請參閱http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html – Feanor 2011-04-18 18:42:24