我是新來的刮。我正在嘗試使用JSOUP從網站上抓取數據。我想從<div>
,<span>
,<p>
等標籤中抓取數據。有人可以告訴我如何做到這一點?用JSOUP刮網
Q
用JSOUP刮網
-3
A
回答
1
檢查this。一個基本的例子:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Test {
public static void main(String[] args) throws Exception {
String url = "https://stackoverflow.com/questions/2835505";
Document document = Jsoup.connect(url).get();
String text = document.select("div").first().text();
System.out.println(text);
Elements links = document.select("a");
for (Element link : links) {
System.out.println(link.attr("href"));
}
}
}
這將首先打印頁上的第一div
的文本,然後打印出網頁上的所有鏈接(a
)的所有URL。
爲了獲得股利的具體類,請Elements elements = document.select("div.someclass")
要與特定的id來獲取申報單,做Elements elements = document.select("div#someclass")
如果你想通過所有選定的元素,這樣做:
for (Element e:elements) {
System.out.println(e.text());
//you can also do other things.
}
相關問題
- 1. 用Jsoup刮
- 2. Java-JSoup刮動態網站
- 3. jsoup問題刮臉網站
- 4. 使用JSoup登錄之前刮網站
- 5. Jsoup的Java刮tickersymbol
- 6. JSOUP問題刮臉表
- 7. 用jsoup和android颳去網站的鏈接
- 8. 用jsoup從頁面中刮取文本
- 9. 使用jsoup刮谷歌廣告
- 10. 使用JSoup的數據刮擦?
- 11. 使用JSoup刮谷歌天氣結果
- 12. 用jsoup在Android中刮開初學者
- 13. 使用JSoup的屏幕刮擦
- 14. 用LUA刮網
- 15. 與Jsoup的網頁刮擦只能運行一半的時間
- 16. Jsoup從div的兒童刮文本
- 17. 更好的方法來與Jsoup刮
- 18. 「屏幕刮」與Jsoup元素誰有ID
- 19. JSoup需要太長的時間來加載和有時使用JSoup刮從網絡數據時不取
- 20. 登錄網站使用jsoup
- 21. 使用Jsoup遍歷網絡
- 22. 刮網站
- 23. Python網絡刮
- 24. 刮網頁
- 25. 刮網址
- 26. 刮網頁
- 27. 刮網址
- 28. 刮網頁
- 29. 網站刮圖
- 30. 刮javascript網站
請告訴我們,到目前爲止您已經嘗試過,SO不是神奇地獲取代碼的地方。 – Zhedar
http://jsoup.org/cookbook/ –
我剛做了一個新項目,並添加了一個jsoup jar文件並建立了連接。我其實是新來的。我想要取消駐留在不同標籤中的數據,如上所示。 plzzz幫助我 –