2016-11-16 29 views

回答

1

我認爲,轉向Python 2.7肯定有反駁的理由。我沒有理由想到,特別是對於網絡爬行,你需要恢復到Python 2.7。

BeautifulSoup 4和lxml都完全移植到Python 3.5。

urllib在Python 3.5中完全可用。你應該知道在Python 2.7和Python 3.5中有urllib的differences in the implementation

但是,我建議你使用Requests包而不是urllib。這裏是一個post突出他們的一些差異。

如果您需要加載需要JavaScript的頁面,Selenium也適用於Python 3.5。 Selenium也可以支持無頭瀏覽(例如PhantomJS)。

另外,這裏有一個來自Python的官方post,可以幫助你引導你的決定。

+0

謝謝:)我將徹底查看這些鏈接。 – ash1234

-2

如果你選擇安裝的標準Python發行之一, 請確保您有Python的2.7.3或更高版本,但不使用Python 3.0或更高版本 ;這些版本當然是最前沿的版本,但是我們將使用的許多軟件包還沒有支持Python 3.X ,直到他們這樣做,3.X並沒有那麼吸引人。對於一個好的 討論Python 3.X的內容和不可用的內容,請參閱選擇 Python版本。

得到了這個website,介紹和討論了Python的網絡cralling。我建議你接受他們的建議。我也經歷過Python 2.7。*是目前應用程序使用其他軟件包的最佳選擇。

+0

非常感謝您的快速回復。:) – ash1234

+0

如果這回答您的問題,請將問題標記爲可以幫助其他人! –

+0

安娜你的答案是善意的,但我會(禮貌地!)爭辯說,現在在2017年,甚至在2016年末,當你發佈時,你鏈接到的那個網站的信息段已過時,無論是在一般情況下還是與關於網絡抓取。站點列出的所有軟件包(從numpy到ipython的1-7)都可以在Python 3中使用,並且已經有一段時間了。偶爾會出現一些邊緣情況,但一般情況下不需要使用2.7,不再需要 – Neil

相關問題