2011-01-24 111 views
5

I'de想通過列表迭代,並打印出來(與詛咒庫以後使用):python unicode初學者:如何打印出一系列字母?

  • U + 0080 ... U + 00FF:拉丁語1補充
  • U + 0100 ... U +拉丁文擴展-A:拉丁語擴展A
  • U + 0180 ... U +國際音標擴展:拉丁文擴展-B
  • U + 0250 ... U + 02AF:IPA擴展
  • U + 02B0 ... U + 02FF:間距修飾字母
  • U + 0300 ... U + 036F:結合變音標記
  • U + 0370 ... U + 03FF:希臘和科普特
  • U + 0400 ... U + 04FF:西里爾
  • U + 0500 ... U + 052F:西里爾補充
  • U + 0530 ... U + 058F:亞美尼亞
  • U + 0590 ... U + 05FF:希伯來語
  • U + 0600 ... U +敘利亞文:阿拉伯語
  • U + 0700 ... U +馬爾代夫語:敘利亞語
  • U + 0750 ... U + 077F:阿拉伯語補充說明
  • U + 0780 ... U + 07BF:塔納文
  • U + 07C0 ... U + 07FF:NKO
  • U + 0800 ... U + 083F:見義勇爲
  • U + 0900 ... U +撒馬利亞語:梵文
  • U + 0980 ... U + 09FF:孟加拉語
  • U + 0A00 ... U + 0A7F:古爾穆基
  • U +古吉拉特文... U + 0AFF:古吉拉特語
  • U + 0B00 .. U + 0B7F:Oriya
  • U + 0B80 ... U + 0BFF:Tamil
  • U + 0C00 .. U + 0C7F:泰盧固語
  • U + 0C80 ... U + 0CFF:卡納達語
  • U + 0D00 ... U + 0D7F:馬來亞

但是Python文檔在那裏只是如何聲明一個字符串,而不是如何動態創建它(如循環中)。我很抱歉,如果這是一個初學者的問題......但我不知道該怎麼做。

再次感謝!

+3

我已經編輯你的問題,因爲你顯然不意味着UTF-8,但統一。這是不同的事情。上面提到的U +代碼不是UTF8,它們是Unicode代碼點。 – 2011-01-24 10:51:11

回答

10

什麼:http://docs.python.org/howto/unicode.html

for i in xrange(0x80, 0xFF): 
    print unichr(i) 
+3

請注意,爲了使其工作,您的標準輸出必須連接到正確配置的終端,這樣python才能檢測終端的編碼(檢查「sys.stdout.encoding」)。如果將輸出重定向到一個文件,它將會失敗。 – nosklo 2011-01-24 10:56:38