我很喜歡用java編程語言,我喜歡從網站中提取數據並將其存儲到我的機器上運行的數據庫中。在java.If中可能會出現這種情況,因此我應該使用哪個API。例如,網站上列出的學校數量如何提取數據並使用java將其存儲到我的數據庫。如何從使用java的網站提取數據?
6
A
回答
7
0
根據您真正想要做的事情,您可以使用許多不同的解決方案。
如果您想要獲取網頁的HTML代碼,那麼URL.getContent()可能是您的解決方案。這裏是一個小教程:
http://www.javacoffeebreak.com/books/extracts/javanotesv3/c10/s4.html
編輯:聽不懂他在尋找一種方式來解析HTML代碼。上面提出了一些工具。對不起。
1
你絕對需要一個像NekoHTML這樣的好解析器。
下面是使用NekoHTML,儘管使用Groovy(一個基於Java的腳本語言)的例子,而不是Java本身:
http://www.keplarllp.com/blog/2010/01/better-competitive-intelligence-through-scraping-with-groovy
1
您可以使用VietSpider XML從
http://sourceforge.net/projects/binhgiang/files/
下載VietSpider3_16_XML_Windows.zip或VietSpider3_16_XML_Linux.zip
VietSpider Web數據提取器:軟件從網站((Data Scraper))抓取數據,格式爲XML標準(Text,CDATA),然後存儲在關係數據庫中。產品支持各種RDBM,如Oracle,MySQL,SQL Server,H2,HSQL,Apache Derby,Postgres ... VietSpider Crawler支持會話(登錄,通過表單查詢),多重下載,JavaScript處理,代理(和多代理通過自動掃描代理網站)...
相關問題
- 1. 使用HtmlAgilityPack從網站提取數據
- 2. 使用python從網站提取數據
- 3. 使用iMacros從網站提取數據
- 4. 使用Python從網站提取數據
- 5. 使用XSLT從網站提取數據
- 6. 從網站提取數據
- 7. 如何從使用php的網站提取某些數據?
- 8. 如何從使用Java的網站中提取受登錄保護的數據?
- 9. 如何從使用Java(Android)的網站上抓取數據?
- 10. 如何使用Excel VBA從網站中提取數據
- 11. 我將如何去使用Python從網站中提取數據?
- 12. 從網站提取數據的方法?
- 13. 如何從多個網站提取數據特定數據
- 14. 使用PHP捲曲從多個網站提取數據提交
- 15. 如何從網站提取神經網絡數據?
- 16. 從網站提取數據Jquery Grid
- 17. 從php其他網站提取數據
- 18. 從網站提取基本數據
- 19. 從Google Play網站提取數據
- 20. Python:從網站提取數據值
- 21. 從網站表中提取數據
- 22. 從其他網站提取數據
- 23. 從第三方網站提取數據
- 24. 從Google App Engine網站提取數據
- 25. 從網站提取元數據
- 26. PHP從網站提取數據
- 27. 從網站提取數據php
- 28. 從使用PHP的網站提取數據
- 29. Java - 從網站讀取數據
- 30. 如何從vb.net的網站中提取數據
Dupes:http://stackoverflow.com/questions/tagged/screen-scraping+java – Jherico 2010-01-11 19:43:05
數百萬的愚蠢! http://stackoverflow.com/questions/26638/what-html-parsing-libraries-do-you-recommend-in-java,http://stackoverflow.com/questions/238036/java-html-parsing等,等 – 2010-01-11 21:34:26