2015-10-09 25 views
0

如何使用Scala迭代Jsoup中的元素?如何使用Scala迭代Jsoup中的元素?

我想實現從網頁中提取所有鏈接,但我無法弄清楚如何在Scala中做到這一點。

+0

那你試試? –

+0

我試着將元素放入迭代器並遍歷它。它現在有效。現在我想知道如何我可以忽略圖像的鏈接。我只想鏈接到html頁面 – user2675516

回答

0

選擇包含整個頁面內容的主div元素後,提取所有錨標記並遍歷每個錨標記並獲取它的鏈接(href)值。

val links = mainElement 
       .getElementsByTagName("a") 
       .asScala 
       .map 
       { 
        anchorItem =>anchorItem.getAttribute("href") 
       } 
1

使用scala.collection.JavaConverters.asScala,你將能夠mapforeach ...

import scala.collection.JavaConverters._ 
val document = Jsoup.parse(html) 
val links = document.select("a").asScala 

links.map { 
    link => //logic 
}