-3
Q
如何抓取網站?
A
回答
2
那麼RSS提要(大概)包含的鏈接是文章鏈接,所以它(大概)歸結爲你的意思是「讀」。
如果您只是需要獲取它們,請使用
URL.getInputStream
或其他一些HTTP客戶端庫。如果您想顯示最終用戶閱讀的新聞文章頁面,那麼您只需要在本機瀏覽器中打開該URL即可。
如果你想提取文章文本,那麼你需要使用合適的HTML解析器解析HTML,或者使用忽略HTML結構的kludgey文本模式識別(blech!)。
相關問題
- 1. scrapy抓取網站
- 2. 安裝抓取,網站抓取庫
- 3. 網站抓取器每隔幾秒就抓取一次網站
- 4. 如何抓取SimpleHTMLDom返回的網站?
- 5. 如何抓取我自己的網站?
- 6. 如何抓取一個網站
- 7. 如何抓取網站證書?
- 8. 如何抓取分類的網站
- 9. 如何從網站上抓取數據
- 10. 如何從網站上抓取信息?
- 11. 如何抓取Hype Machine等網站?
- 12. 搜索引擎如何抓取網站?
- 13. 如何使用scrapy抓取網站?
- 14. 如何解析/抓取/抓取特定信息的網站?
- 15. 網站抓取問題網站
- 16. 我如何從Python網站抓取網站上的pdf鏈接
- 17. 我如何從R網站抓取這個網站的信息?
- 18. apache nutch不抓取網站
- 19. 抓取網站使用PHP
- 20. 網站抓取和截圖
- 21. 抓取整個網站python
- 22. 網站內容抓取
- 23. 從網站抓取數據
- 24. 從網站抓取文本
- 25. 從網站抓取數據
- 26. Scrapy - 抓取和刮網站
- 27. 從網站抓取圖片
- 28. 從網站抓取TEXT ONLY
- 29. 如何抓取網站並截取每個網頁的截圖?
- 30. 軟件抓取/抓取網站的網址