回答
你的連接錯誤是:socket.error:[錯誤54]通過對 連接復位當你第一次連接到http://www.gamespot.com 你必須趕上餅乾,並用它在響應的頭部其他頁面。
您只向服務器發送HTTP請求。你需要處理Javascript來獲取內容。
帶有Javascript支持的無頭瀏覽器,如Ghost,它會是一個不錯的選擇。
from ghost import Ghost
ghost = Ghost()
ghost.open(link)
page, resources = ghost.evaluate('document.documentElement.innerHTML;')
soup = BeautifulSoup(page)
.evaluate('document.documentElement.innerHTML')
將顯示動態生成的內容,而不是你會看到考慮看看源的靜態。
顯然,鬼沒有打開的屬性?我安裝在http://ghostpy.readthedocs.org/en/latest/#examples這裏顯示的依賴關係上,但ghost.open()不可用。 – Aerole
它有。 您需要先安裝pyqt4。你有這裏的二進制文件:http://www.riverbankcomputing.co.uk/software/pyqt/download 然後'pip安裝ghost.py'。不僅'鬼' –
- 1. 美麗的湯錯誤
- 2. 美麗的湯URL錯誤
- 3. 錯誤與美麗的湯
- 4. 在沒有html標籤的情況下搜索美麗的湯汁輸出
- 5. 沒有輸出與美麗的湯find_all
- 6. 蟒蛇美麗的湯輸出到excel
- 7. 將美麗的湯輸出寫入CSV
- 8. 美麗的湯分揀輸出
- 9. 美麗的湯的Unicode編碼錯誤
- 10. 美麗的湯解碼錯誤
- 11. 美麗的湯4打印soup.find_all錯誤
- 12. 美麗的湯 - 處理錯誤
- 13. 美麗的湯空元素錯誤
- 14. 美麗的湯獲取屬性錯誤
- 15. 美麗的湯無類型錯誤
- 16. 使用美麗的湯處理錯誤
- 17. Python美麗的湯
- 18. 在美麗的湯
- 19. 與美麗的湯
- 20. 用美麗的湯
- 21. 與美麗的湯
- 22. Python美麗的湯 - 獲取輸入值
- 23. 美麗的湯錯誤:列表索引超出範圍
- 24. 美麗的湯:列出所有屬性
- 25. 美麗的湯表沒有出現
- 26. 美麗的湯解析表
- 27. 蟒蛇美麗的湯JSON
- 28. Webscrape沒有美麗的湯
- 29. 多選美麗的湯
- 30. Python Web Scraping;美麗的湯
它可能會阻止/重定向你認爲你是一個bot:你可能必須設置你的用戶代理。 –