我正在使用Python進行網絡爬行。我在使用Python版本3時遇到了問題。所以我想知道哪個版本的Python適合於網頁爬行。要使用BeautifulSoup和urllib的哪個Python版本?
回答
我認爲,轉向Python 2.7肯定有反駁的理由。我沒有理由想到,特別是對於網絡爬行,你需要恢復到Python 2.7。
BeautifulSoup 4和lxml都完全移植到Python 3.5。
urllib在Python 3.5中完全可用。你應該知道在Python 2.7和Python 3.5中有urllib的differences in the implementation。
但是,我建議你使用Requests包而不是urllib。這裏是一個post突出他們的一些差異。
如果您需要加載需要JavaScript的頁面,Selenium也適用於Python 3.5。 Selenium也可以支持無頭瀏覽(例如PhantomJS)。
另外,這裏有一個來自Python的官方post,可以幫助你引導你的決定。
謝謝:)我將徹底查看這些鏈接。 – ash1234
如果你選擇安裝的標準Python發行之一, 請確保您有Python的2.7.3或更高版本,但不使用Python 3.0或更高版本 ;這些版本當然是最前沿的版本,但是我們將使用的許多軟件包還沒有支持Python 3.X ,直到他們這樣做,3.X並沒有那麼吸引人。對於一個好的 討論Python 3.X的內容和不可用的內容,請參閱選擇 Python版本。
得到了這個website,介紹和討論了Python的網絡cralling。我建議你接受他們的建議。我也經歷過Python 2.7。*是目前應用程序使用其他軟件包的最佳選擇。
- 1. 哪個URLLIB包使用Python
- 2. 使用Python/urllib/beautifulsoup從URL批量下載文本和圖像?
- 3. 網絡使用beautifulSoup和urllib的
- 4. BeautifulSoup的哪個版本適用於GAE(python 2.5)?
- 5. 本地HTML文件刮擦Urllib和BeautifulSoup
- 6. 要使用哪個版本的JBoss AS?
- 7. 要使用哪個版本的導軌
- 8. 要使用哪個版本的Hadoop API
- 9. 使用urllib和BeautifulSoup從Python中檢索信息
- 10. 應該使用哪個版本的Python?
- 11. __future__ import with_statement需要哪個python版本?
- 12. 要學哪個python版本? (noob問題)
- 13. 如何告訴python要使用哪個版本的libmysqlclient.so?
- 14. MySQL要使用哪個版本?
- 15. 要使用哪個hadoop版本?
- 16. 要使用哪個SQL Server 2008版本
- 17. 推薦odoo使用哪個python版本?
- 18. 使用beautifulsoup和python
- 19. Python 3 | PyQt5 - QWebEngineView + urllib + beautifulsoup與Cookies
- 20. 要使用哪個版本的CXF和spring?
- 21. 決定使用哪個python版本用於點和easy_install
- 22. 蟒蛇 - 網頁抓取BeautifulSoup和urllib的
- 23. Urllib和BeautifulSoup靈活的urlopen()選項
- 24. 我應該使用哪個urllib屬性來代替Pycharm版本4.5.4中的urllib.quote()?
- 25. 哪個版本的Python用於schemacrawler
- 26. 用Python-BeautifulSoup和urllib網頁抓取一個奇怪的html安裝程序
- 27. Python和Gtk--正在使用哪個GTK版本?
- 28. Python和urllib
- 29. 機械化,urllib,beautifulsoup和相對路徑
- 30. 要使用哪種Spring&Hibernate版本
嘗試版本2.7,這適用於大多數應用程序版本。 –