是否可以通過Python進行HTML抓取，數據挖掘？

我可以收集智能數據，HTML使用python刮？我不知道它，所以我想想一些想法。是否可以通過Python進行HTML抓取，數據挖掘？

2011-04-30 Mahakaal

[Python和數據挖掘]的可能重複（http://stackoverflow.com/questions/1321749/python-and-data-mining） – 2011-05-23 00:04:36

看着模塊scrapy：

2011-04-30 16:22:33

嘗試使用的urllib2和美味的湯。

的urllib2是請求的URL編程有用的。這是標準庫的一部分：http://docs.python.org/library/urllib2

美麗的湯是很好的挖掘HTML/XML，並可以在這裏找到：http://pypi.python.org/pypi/BeautifulSoup

2011-04-30 21:23:47

你當然可以 - 我在Python開發this library我的網頁抓取工作。

一個很好的解析庫是lxml。

如果你是新來的Python你可能想通過this ebook工作第一。

2011-05-03 14:42:28 hoju

的鏈接都死了。 – 2016-05-12 09:01:53

@TilakMadichetti不，他們不是。 – SmallChess 2016-11-01 02:24:12

抱歉！那時候我的網絡出現了問題。我的錯：） – 2016-11-05 10:16:52

您也可以使用htql庫在：http://htql.net。

2011-05-23 00:00:12 seagulf

回答