0
我正在使用scrapy進行使用python進行網頁爬行。雖然刮我有一些字符,不正確編碼像'\ xa0','\ x0259'。任何幫助我怎樣才能在Python中處理它們?scrapy數據在python中編碼不正確
我正在使用scrapy進行使用python進行網頁爬行。雖然刮我有一些字符,不正確編碼像'\ xa0','\ x0259'。任何幫助我怎樣才能在Python中處理它們?scrapy數據在python中編碼不正確
您可以使用unicode字符串類型(http://docs.python.org/2/tutorial/introduction.html#unicode-strings),並將這些字符的所有實例都與u
一致。例如u'\xa0'
和u'\x0259'
。 unicode字符串python文檔還提供了一些其他方法來編碼和解碼這些字符串和字符。
你看過http://stackoverflow.com/questions/10735836/scrapy-spider-dealing-with-pages-that-have-incorrectly-defined-character-encodi? –
你需要提供更多的上下文 - 你有一些代碼? Scrapy提供了一個允許你處理unicode的API,但是在這裏你向我們展示了一些字符,我不知道它們來自哪裏,什麼是正確的字符編碼,或者你想要對它們做什麼。 –