2016-08-21 77 views
0

我試圖解析Groovydoc,但Jsoup沒有找到包含所有東西的框架集。無法解析框架集的網頁

 Connection connection=Jsoup.connect('http://groovy-lang.org/api.html') 
     Document document=connection.get() 
     Elements element= document.getElementsByTag('frameset') 
     element.each {println(it)} 

回答

0

如果您檢查由connection.get()返回的結果可以看到,有沒有frameset標籤:

println document 

現在,如果你在瀏覽器中打開該網站,並使用開發工具來看看在它的html代碼中,您可以看到frameset您正在尋找的是來自http://docs.groovy-lang.org/latest/html/gapiiframe的孩子。

只需加載iframe網址與Jsoup得到frameset

Connection connection = Jsoup.connect('http://docs.groovy-lang.org/latest/html/gapi') 
Document document = connection.get() 
Elements element = document.getElementsByTag('frameset') 
element.each { println it } 

或者,如果你不想硬編碼iframe源URL解析,看this如何獲取源URL,這樣回答