是否有任何可靠的方法來找出指向我們詳細新聞頁面的鏈接集合。換句話說,在訪問網站的第一頁之後,我只想要那些指向新聞項目的鏈接。任何解決方案從新聞網站摘錄新聞鏈接
0
A
回答
0
如果是針對某個特定的網站,您可以隨時嘗試獲取該網站的HTML並使用正則表達式提取到新聞報道的鏈接。只需在HTML中找到代碼可用於識別鏈接位置的部分即可。
我這樣做了幾次,以從網站上刮取一些信息。
但也許一個明顯的問題,網站上沒有RSS提要?
0
你可以做一個簡單的WebRequest並下載一個頁面並搜索你想要解析的內容的html。
WebRequest req = WebRequest.Create
("http://www.domain.com/news.html");
req.Proxy = null;
using (WebResponse res = req.GetResponse())
using (Stream s = res.GetResponseStream())
using (StreamReader sr = new StreamReader(s))
File.WriteAllText("news.html", sr.ReadToEnd());
//search through html page for news content.
System.Diagnostics.Process.Start("news.html");
相關問題
- 1. 谷歌新聞如何從不同的新聞網站拉新聞鏈接?
- 2. 新聞ID TYPO3的RealURL新聞鏈接
- 3. 無法湊新聞網站
- 4. 用Python刮新聞網站
- 5. 新聞網站排名
- 6. 生成一種智能新聞摘錄
- 7. 如何製作新聞網站新聞可搜索
- 8. Android - 從網站閱讀新聞
- 9. 鏈接列表像新聞列表或新聞股票
- 10. 從Google新聞獲取鏈接列表
- 11. 重定向從/新聞到/新聞/
- 12. 總新聞在新聞組
- 13. 新聞網站與PHP和鏈接使用重寫規則
- 14. 新聞聚合器網站託管
- 15. 新聞網站的Java矯枉過正?
- 16. 聯機新聞網站的RDF數據
- 17. 新聞網站爬行不起作用?
- 18. Google Blogger新聞提要網站
- 19. 新聞網站的SQL表結構
- 20. 如何使新聞列表從新聞節目包作爲新聞列表
- 21. 添加新聞頁面後,新聞沒有出現在Morea Framework網站上
- 22. 添加鏈接到Facebook新聞訂閱
- 23. 簡單新聞鏈接404錯誤
- 24. 新聞提要API的一般新聞
- 25. 新聞供稿網頁
- 26. 從谷歌新聞中提取前10條新聞
- 27. 無法從黑客新聞中刮取新聞標題
- 28. 新聞聚類
- 29. 顯示新聞
- 30. TYPO3新聞hidePagination