Q

國際文本的Scrapy問題

2011-08-25 44 views 1 likes

1

我確實使用scrapy從網頁上抓取文本。在蜘蛛，我有這樣的代碼：國際文本的Scrapy問題

title = hxs.select("//h1/text()").extract() #1 
final_text = title[0].encode('utf-8') #2

這裏的問題是線＃1給出[u'Puerto潘基文\ xfas'] 線＃2給出了波多黎各潘基\ XC3 \ xbas

但原文是波多黎各巴努斯。我怎樣才能得到這個原始的保存和顯示？

2011-08-25 Elisa

A

回答

1

>>> print u'Puerto Ban\xfas' 
Puerto Banús 
>>> print 'Puerto Ban\xc3\xbas' 
Puerto Banús

我在這裏沒有看到問題。

2011-08-25 06:23:55 wRAR

相關問題

11. iTextSharp的國際文本
12. 提取國際化文本
13. 顯示國際文本
14. ExtJS - 多國語言與國際文本
15. 的Python和Scrapy：問題與Scrapy版本
16. 關於Qt國際化的問題
17. 國際化的波蘭字符問題
18. 變量的PyQt5國際化問題
19. HPUX上的wcwidth問題：HPUX上的國際化和本地化問題
20. 問題和Django/Dajaxice和國際字符
21. 國際象棋分層問題
22. 國際化問題jquery.i18n.properties-1.0.9.js
23. WrapMode問題與國際語言
24. django國際化和翻譯問題
25. 施普雷國際化問題
26. Alaxos Acl插件國際化問題
27. .net mvc 2國際化文本文件
28. 問題與日本/國際字符與IIS7 URL重寫
29. Apache struts國際化和本地化問題
30. JavaME國際化（國際化）