模塊encoding
提供不同的編碼,然後在HTML頁面請求模塊編碼提供不同的編碼然後HTML編碼
代碼的實際集編碼的請求:
import requests
URL = "http://www.reynamining.com/nuevositio/contacto.html"
obj = requests.get(URL, timeout=60, verify=False, allow_redirects=True)
print obj.encoding
輸出:
ISO-8859-1
作爲實際的編碼集在HTML爲UTF-8
content="text/html; charset=UTF-8"
我的問題是:
- 爲什麼
requests.encoding
呈現不同的編碼,然後在HTML頁面中描述的編碼?
我試圖編碼轉換爲UTF-8使用此方法objReq.content.decode(encodes).encode("utf-8")
,因爲它已經在UTF-8
當我與ISO-8859-1解碼和使用UTF-8編碼值得到改變IE)á
對此的更改Ã
是否有任何方法將所有類型的編碼轉換爲UTF-8?
非常感謝,它非常豐富:)。 – The6thSense
給出的代碼片斷會爲'URL'產生'None'類型的錯誤,例如'http://www.uraniumenergy.com/contact_us/contact_information '請問爲什麼會發生這種情況以及如何避免它? – The6thSense
@ The6thSense:不知道;我嘗試時沒有遇到任何錯誤。你有追溯嗎? –