Q

解析HTML代碼中的URL C++

2014-02-16 35 views 0 likes

0

我在C++中創建了一個簡單的網絡爬蟲。目前我已經設法從種子URL獲取HTML代碼，並保存在字符串或文本文件中。解析HTML代碼中的URL C++

如何查找並保存HTML中的URL我想繼續我的網頁爬行？

2014-02-16 tossvokey

+0

通過解析您讀取的文件中的HTML。注意：它不*無關緊要。 –

A

回答

0

要做到這一點，你需要一個合適的HTML解析器。 Gumbo是一個開源的HTML5語法分析器，由Google編寫開發源代碼，您可以使用它來實現類似這樣的事情。

2014-02-16 13:44:36

相關問題

11. 解析HTML代碼塊
12. 解析VB.NET中的HTML字符代碼
13. 從html代碼解析url的正則表達式
14. C++解析代碼（手寫）
15. 解析Python代碼從C++
16. 解析C＃中的SQL代碼＃
17. 解析url的一些代碼
18. 解析HTML源代碼，JavaScript的問題
19. 解析JavaScript代碼的HTML源
20. 如何解析XML代碼的HTML
21. 解析HTML頁面中的URL
22. HTML解析c＃
23. 通過C＃解析/重構C＃代碼
24. C＃httplistener解析<% c# %>代碼
25. 將未解析的HTML代碼顯示到html iframe中
26. gcc解析代碼
27. 解析大字符串（HTML代碼）
28. JavaFX WebView HTMLElement - html代碼無法解析
29. 解析HTML和服務器端代碼
30. PHP從html解析一些代碼