2017-03-07 43 views
-1

我一直在爲馬拉雅拉姆新聞文章做主題建模。主題以unicode格式生成。輸出如下:使用python( u0d35格式)將unicode數據轉換爲malayalam

u'0.021*"\u0d2a\u0d3f" + 0.021*"\u0d35\u0d3f\u0d36\u0d4d\u0d35\u0d02\u0d2d\u0d30\u0d28\u0d4d\u0d31\u0d46" + 0.021*"\u0d05\u0d26\u0d4d\u0d26\u0d47\u0d39\u0d02"' 

我想將其轉換爲可讀的字符串。每當涉及文件操作時,它只是在輸出文件中顯示相同的字符串。但是,我要像結果:

0.021*"പി" + 0.021*"വിശ്വംഭരന്റെ" + 0.021*"അദ്ദേഹം" 

到一個文件

回答

0

似乎好工作對我來說...請務必打印到終端支持它(以及黨是截圖不是一樣id作爲可讀希望......哦,好吧,如果你點擊它的罰款) enter image description here

如果你想要把它寫到你可能需要對文件進行編碼它UTF8

with open("some_file","wb") as f: 
    f.write(u'0.021*"\u0d2a\u0d3f" + 0.021*"\u0d35\u0d3f\u0d36\u0d4d\u0d35\u0d02\u0d2d\u0d30\u0d28\u0d4d\u0d31\u0d46" + 0.021*"\u0d05\u0d26\u0d4d\u0d26\u0d47\u0d39\u0d02"'.encode("utf-8")) 
相關問題