0
我想弄清楚什麼是需要做的事情,我相信是一個有點簡單的任務,但似乎它的執行有點進步。Java,查詢一系列.HTML幫助
有人可以提供一個例子,可以幫助我找出以下目標嗎?本地服務器上
- 檢查各種已知的.html文件的字符串
- 如果字符串是Que_for_board預製棒其他字符串的解析,將在文件 例:發行數據,作者,項目等
- 否則(如果沒有找到Que_for_board)進入下一個HTML
- 注意到的結果,並打印到文件
這是很難,因爲它似乎?我查看了HTMLCleaner解析器,但不知道是否需要將HTML清理成XML,而且我發現很難找到具有下一步詳細信息的查詢代碼。
http://jsoup.org/ – BalusC