我想創建一個java程序,檢測網頁上的HTML元素的變化。例如:http://timer.onlineclock.net/Java的HTML元素閱讀
隨着時間的推移,時鐘的HTML元素會更改它們顯示的圖像的來源。無論如何,使用java,我可以高效地打開一個連接到這個頁面,並能夠看到這些元素何時改變?
我已經使用了HTMLUnit,但是我決定花費很長時間才能加載一個頁面以被認爲足夠高效。
我知道如何使用URL的唯一方法是使用BufferedReader讀取頁面,然後使用正則表達式解析源代碼中的HTML元素,但這需要我「重新加載」每次我想查看一個元素的屬性時,任何人都可以給我一個建議,告訴我如何在幾毫秒內檢測到這些變化,而不需要使用太多的網絡資源?
如果你想解析HTML,最好使用現有的HTML解析器,而不是自己編寫。您無法使用正則表達式解析HTML(請參閱http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html)。也許更好的問題是你想要做什麼?你可以通過將HTML視爲文本字符串並區分2個字符串來完成同樣的任務嗎? –