2015-10-04 191 views
0

Python可以將Unicode實體轉換爲Unicode嗎? ex) \u0639\u0631\u0628\u0649 to عربى將Unicode實體轉換爲Unicode文本

我想這是可以做到in this website

這將幫我解析JSON的unicode實體FYI產生有效的URL

ex) 'S\\u00f8ren Kierkegaard' -> https://en.wikipedia.org/wiki/Søren_Kierkegaard

,如果你使用維基百科的API完全一樣的東西,您將遇到很多對象,如'\\u00f8'https://en.wikipedia.org/w/api.php?action=query&titles=Søren_Kierkegaard&prop=revisions&rvprop=content&format=json

+0

當我看到我一直在努力與這個「概念簡單」的東西幾個小時這樣的unicode的問題,我真的很害怕,渾身發抖:) – marmeladze

+0

。我現在感到頭暈。 – SUNDONG

+0

你的問題有點不清楚。你有什麼類型的字符串?它是否必須使用'%uxxxx'模式?你知道如何用Python的風格來表示事物,你不能只是轉換它嗎? –

回答

4

Python支持編碼調用ED unicode-escape,這將有助於在這裏:​​

>>> br'\u0639\u0631\u0628\u0649'.decode('unicode-escape') 
'عربى' 
0
$ python 
Python 2.7.6 (default, Jun 22 2015, 17:58:13) 
[GCC 4.8.2] on linux2 
Type "help", "copyright", "credits" or "license" for more information. 
>>> a = u'\u0639\u0631\u0628\u0649' 
>>> print a 
عربى 
>>>