Python中有沒有其他的機械化方法？

12

SeleniumRC與selenium.py是一個替代方案（如果您需要刮取的頁面對於Javascript操作具有重要的「結構」角色，尤其是AJAX-y，因爲Mechanize不執行它正在抓取的頁面上的Javascript）。

2010-04-18 15:27:38

7

對於抓取和表單處理，您可以使用lxml.html（儘管它不會自動抓取和cookie）。

scrapy是一個專門用於抓取的庫。

2010-04-18 16:24:45

3

我用了twill來滿足很多測試需求。它可以作爲「網頁瀏覽」的獨立語言，也可以作爲Python的圖書館。它實際上使用了機械化，因此我不確定它是否能夠滿足您的需求 - 您是否遇到機械化固有的問題，或者您是否會從高層獲益？

2010-04-19 05:38:57 ars

1

2010-10-03 13:11:48

+0

它實際上使用機械化。 – 2016-02-03 17:53:03

3

我已經成功地與Splinter，建立在硒之上的解決方案 - 同時提供更Python API。

2012-11-12 19:51:13 jmu

1

2013-03-04 10:20:33

回答