我可以收集智能數據,HTML使用python刮?我不知道它,所以我想想一些想法。是否可以通過Python進行HTML抓取,數據挖掘?
回答
看着模塊scrapy:
嘗試使用的urllib2和美味的湯。
的urllib2是請求的URL編程有用的。這是標準庫的一部分:http://docs.python.org/library/urllib2
美麗的湯是很好的挖掘HTML/XML,並可以在這裏找到:http://pypi.python.org/pypi/BeautifulSoup
的鏈接都死了。 – 2016-05-12 09:01:53
@TilakMadichetti不,他們不是。 – SmallChess 2016-11-01 02:24:12
抱歉!那時候我的網絡出現了問題。我的錯 :) – 2016-11-05 10:16:52
您也可以使用htql庫在:http://htql.net。
- 1. 使用Python進行數據挖掘
- 2. HTML數據挖掘
- 3. python數據挖掘
- 4. 數據挖掘SSE通過集羣K
- 5. 使用Sql Server進行數據挖掘
- 6. 使用Neo4j進行數據挖掘
- 7. 使用Python進行文本挖掘
- 8. Kissmetrics數據挖掘
- 9. Web刮,數據挖掘,數據提取
- 10. 遞歸挖掘後沒有數據抓取
- 11. 關於使用twitter數據進行數據挖掘
- 12. 數據挖掘庫和許可限制
- 13. 挖掘PDF數據與Python通過剪貼板 - Python腳本操作系統
- 14. 是否可以從FaceBook中挖掘校友信息
- 15. 數據挖掘 - K近鄰
- 16. 休眠4數據挖掘
- 17. JSON到R數據挖掘
- 18. 數據挖掘字符串
- 19. hadoop的數據挖掘庫
- 20. 數據挖掘情況
- 21. R數據挖掘語法
- 22. 「相似性」數據挖掘
- 23. Google數據挖掘工具
- 24. 從數據挖掘開始
- 25. 數據挖掘教科書
- 26. 什麼是數據挖掘模型?
- 27. 安排將SQL數據庫導出到NoSQL以進行圖形數據挖掘是否合理?
- 28. 的Oracle SQL導航數據挖掘文本挖掘
- 29. 讀取HTML代碼爲R的數據和文本挖掘
- 30. 可以禁用日誌以防止進程挖掘
[Python和數據挖掘]的可能重複(http://stackoverflow.com/questions/1321749/python-and-data-mining) – 2011-05-23 00:04:36