Q

urllib read（）更改屬性

2016-09-17 93 views 0 likes

0

我有一個基本腳本，它要求網站獲取html源代碼。抓取多個網站時，我發現源代碼中的不同屬性代表錯誤。urllib read（）更改屬性

實施例：

from urllib import request 

opener = request.build_opener() 
with opener.open("https://www.w3.org/Protocols/rfc2616/rfc2616-sec4.html#sec4.2") as response: 
    html = response.read() 
print(html)

我比較了結果（html VAR）與源代碼由鉻和Firefox表示。

我看到這樣的差異：

Browser      Urllib 

href='rfc2616.html'   href=\'rfc2616.html\' 
rev='Section'     rev=\'Section\' 
rel='xref'      rel=\'xref\' 
id='sec4.5'     id=\'sec4.4\'

它看起來像urllib是把反斜線這裏逃脫代碼。

這是一個內心深處的問題urllib還是有什麼辦法解決這個問題嗎？

在此先感謝。印刷時，其轉義序列沒有得到解釋

2016-09-17 Luke Skywalker

A

回答

0

responce.read()會返回一個bytes對象，請參閱：

print(b'hello\nworld') # prints b'hello\nworld'

你需要decode它str其中，在打印時，正確評估逃逸：

print(html.decode())

2016-09-17 18:38:25

相關問題

1. AttributeError：'dict'對象沒有屬性'read'
2. 在urllib中執行.read（）之後，在urlib .read（）中查找數據
3. 更改屬性
4. 更改屬性
5. 更改屬性
6. 更改屬性
7. 更改屬性
8. 更改屬性值
9. WebComponents - 屬性更改
10. 更改href屬性

11. 更改document.readyState屬性
12. 更改CSS屬性
13. MPMediaItem更改屬性
14. 更改屬性magento
15. 更改類屬性
16. 更改屬性值
17. XML更改屬性
18. UserControl屬性更改
19. 更改onclick屬性
20. 更改HTML屬性
21. jquery更改屬性
22. 更改ABPeoplePickerNavigationController屬性
23. 更改屬性值
24. 更改css屬性
25. 更改可見性屬性
26. 更改彈性屬性
27. 更改屬性值會導致所有屬性的更改
28. 如何在MVVM中更改其他屬性時更改屬性
29. 當SelectedIndex屬性更改時，ListBox的SelectedItem屬性發生更改？
30. 更改「父」屬性的屬性