我有一個從網站獲取多語言信息的Python應用程序,它將它們呈現在一個小的GUI窗口(基於wxpython)中。
我(當前)不在我的源文件中使用任何特定的unicode語句。Python,unicode支持的最佳途徑?
現在,當我在Eclipse中運行我的python應用程序時,法語字符(如ë)很好地顯示出來,當我從py2exe打包版本運行它時,字符變得非常奇怪。 我真的不明白爲什麼與py2exe建設不會產生unicode或編碼相關的錯誤。
但是,要解決這個問題,並按照this文章中,我包裹着我的unicode(my_string, "utf-8")
通話字符串只是將其輸出到屏幕之前。這解決了它。
問題:
在unicode()
通話
- 披着字符串之前顯示好辦法做到這一點?
- 爲什麼它在沒有從Eclipse內部進行unicode轉換的情況下工作,而不是從Windows打包的.exe版本轉換而來?
我試過在unicode中繞過我的頭多次,但看起來我不是unicode兼容的: - |
那麼,我使用'urllib2.urlopen()',我使用美麗的湯解析。根據[BeautifulSoup的文檔](http://www.crummy.com/software/BeautifulSoup/documentation.html#Beautiful%20Soup%20Gives%20You%20Unicode,%20Dammit),它應該總是返回unicode。但是如果我在我的任何一個Beuatiful Soup上輸入(值)'返回最終值,我會得到''而不是預期的'(當我做'打印值'時,它不會預先字符串前面的「u」)。所以我不相信我真的從那裏使用unicode。 –
Rabarberski
2011-05-30 11:38:33
儘管文檔中提到(http://www.crummy.com/software/BeautifulSoup/documentation.html#Beautiful湯給你Unicode,Dammit),有很多情況下BeautifulSoup不返回unicode,請參閱http:///stackoverflow.com/questions/3192645/beautifulsoup-doesnt-give-me-unicode。恕我直言lxml更好地工作,並更一致的刮。 – 2011-05-30 12:08:38
是的,我剛剛發現了一個相關的SO帖子:http://stackoverflow.com/questions/843227/how-to-render-contents-of-a-tag-in-unicode-in-beautifulsoup確實描述了同樣的問題:'renderContents()'(我正在使用)返回一個字符串,而不是unicode。 – Rabarberski 2011-05-30 12:16:09