通過python腳本查找unicode範圍

有沒有辦法找到unicode範圍，以便我可以用不同的html標籤標記unicode。由於我混合了需要打印的unicode。因此需要不同的unicode的不同標籤，以便不同的CSS字體可以應用於模板中的這些標籤。通過python腳本查找unicode範圍

我正在使用python，flask，jinjatemplate。只需要一種方法來查找python腳本的範圍。

例如http://symbolcodes.tlt.psu.edu/bylanguage/devanagarichart.html Unicode的從&＃x0905按照從這個鏈接，

來源

2013-08-26 beebek

也許你可以使用ord()功能啓動。它返回字符數值，你可以決定如何處理字符。

例子：

devanagari_letter_a = unichr(2309) 
devanagari_letter_aa = unichr(2310) 

print devanagari_letter_a.encode('utf-8'), 'value:', ord(devanagari_letter_a) 
print devanagari_letter_aa.encode('utf-8'), 'value:', ord(devanagari_letter_aa)

輸出：

अ value: 2309 
आ value: 2310

來源

2013-08-26 08:29:56

感謝@simon，我需要一大堆天城文vocabulari的測試，所以我覺得我可以用Unicode數據庫，我發現在檢查ftp://ftp.unicode.org/Public/UNIDATA/UnicodeData.txt – beebek

是的，正好。但要注意數字的基礎。 ord（）返回10的數字基數，但在unicode數據庫中以十六進制格式存儲數字。 0905 =十六進制（2309）和2309 = int（'0905'，16） –

通過python腳本查找unicode範圍

回答

相關問題