scrapy數據在python中編碼不正確

我正在使用scrapy進行使用python進行網頁爬行。雖然刮我有一些字符，不正確編碼像'\ xa0'，'\ x0259'。任何幫助我怎樣才能在Python中處理它們？scrapy數據在python中編碼不正確

2013-07-18 Waheed Khan

你看過http://stackoverflow.com/questions/10735836/scrapy-spider-dealing-with-pages-that-have-incorrectly-defined-character-encodi？ –

你需要提供更多的上下文 - 你有一些代碼？ Scrapy提供了一個允許你處理unicode的API，但是在這裏你向我們展示了一些字符，我不知道它們來自哪裏，什麼是正確的字符編碼，或者你想要對它們做什麼。 –

您可以使用unicode字符串類型（http://docs.python.org/2/tutorial/introduction.html#unicode-strings），並將這些字符的所有實例都與u一致。例如u'\xa0'和u'\x0259'。 unicode字符串python文檔還提供了一些其他方法來編碼和解碼這些字符串和字符。

來源

2013-10-23 19:12:25 ngutzmann

scrapy數據在python中編碼不正確

回答

相關問題