2013-12-09 213 views
0

我有這樣的數據文件:蟒蛇ASCII到Unicode轉換

\r\n\tSoci\u00e9t\u00e9 implant\u00e9 dans l'internet recrute des t\u00e9l\u00e9conseillers en b to b pour effectuer de la prise de rendez-vous qualifi\u00e9 pour de la conception de site internet et du r\u00e9f\u00e9rencement google. 

我怎麼可以打印爲Unicode,就像這樣:

Société implanté dans l'internet recrute des téléconseillers en b to b pour effectuer de la prise de rendez-vous qualifié pour de la conception de site internet et du référencement google. 

我知道我必須使用某些Unicode功能,但什麼?

+0

這是Python 2還是3? –

+0

Python版本2.7 –

+1

這些數據來自哪裏?它也可以是JSON(雖然JSON格式不正確,除非此文件比您在此處發佈的更多)。 –

回答

2

這看起來像一個python unicode字符串文字;從unicode_escape解碼。

演示:

>>> data = "\r\n\tSoci\u00e9t\u00e9 implant\u00e9 dans l'internet recrute des t\u00e9l\u00e9conseillers en b to b pour effectuer de la prise de rendez-vous qualifi\u00e9 pour de la conception de site internet et du r\u00e9f\u00e9rencement google." 
>>> data.decode('unicode_escape') 
u"\r\n\tSoci\xe9t\xe9 implant\xe9 dans l'internet recrute des t\xe9l\xe9conseillers en b to b pour effectuer de la prise de rendez-vous qualifi\xe9 pour de la conception de site internet et du r\xe9f\xe9rencement google." 
>>> print data.decode('unicode_escape') 

    Société implanté dans l'internet recrute des téléconseillers en b to b pour effectuer de la prise de rendez-vous qualifié pour de la conception de site internet et du référencement google. 

您可以將數據從文件中讀取它(使用二進制模式)進行解碼,也可以在Python 2,或定期open()在Python 3使用io.open()有在飛行中解碼的數據:

from io import open 

with open(filename, 'r', encoding="unicode_escape") as inputfile: 
    for line in inputfile: 
     print(inputfile) 

請注意,JSON字符串使用相同的轉義語法; \uhhhh表示僅使用ASCII字符的Unicode代碼點。

+0

謝謝它的作品 –