2013-08-26 49 views
0

有沒有辦法找到unicode範圍,以便我可以用不同的html標籤標記unicode。由於我混合了需要打印的unicode。因此需要不同的unicode的不同標籤,以便不同的CSS字體可以應用於模板中的這些標籤。通過python腳本查找unicode範圍

我正在使用python,flask,jinjatemplate。只需要一種方法來查找python腳本的範圍。

例如http://symbolcodes.tlt.psu.edu/bylanguage/devanagarichart.html Unicode的從&#x0905按照從這個鏈接,

回答

0

也許你可以使用ord()功能啓動。它返回字符數值,你可以決定如何處理字符。

例子:

devanagari_letter_a = unichr(2309) 
devanagari_letter_aa = unichr(2310) 

print devanagari_letter_a.encode('utf-8'), 'value:', ord(devanagari_letter_a) 
print devanagari_letter_aa.encode('utf-8'), 'value:', ord(devanagari_letter_aa) 

輸出:

अ value: 2309 
आ value: 2310 
+0

感謝@simon,我需要一大堆天城文vocabulari的測試,所以我覺得我可以用Unicode數據庫,我發現在 檢查ftp://ftp.unicode.org/Public/UNIDATA/UnicodeData.txt – beebek

+0

是的,正好。但要注意數字的基礎。 ord()返回10的數字基數,但在unicode數據庫中以十六進制格式存儲數字。 0905 =十六進制(2309)和2309 = int('0905',16) –