所以我在Python中使用'æ','ø'和'å'時會出現這個奇怪的問題。Python中的斯堪的納維亞字母2.7
我已經包括:# - - 編碼:UTF-8 - -
在每個文件的頂部,並æøå印刷精美所以不用擔心那裏。但是,如果我做len('æ')
我得到2.我正在做一個程序,我循環和分析丹麥文本,所以這是一個大問題。 下面是從Python的終端一些例子來說明這個問題:
In [1]: 'a'.islower()
Out[1]: True
In [2]: 'æ'.islower()
Out[2]: False
In [3]: len('a')
Out[3]: 1
In [4]: len('æ')
Out[4]: 2
In [5]: for c in 'æ': print c in "æøå"
True
True
In [6]: print "æøå are troublesome characters"
æøå are troublesome characters
我能找到解決islower判斷()和isupper(的問題),不工作的「æ」,「O」和「a」通過只是在做c.islower() or c in "æøå"
來檢查c是否是小寫字母,但如上所示,'æ'的兩部分都將被視爲小寫字母並被計爲雙精度。
有沒有辦法讓這些字母像其他字母一樣行事?
我在windows 10上運行python 2.7,使用canopy作爲獲取我需要的sklearn和numpy的簡單方法。
謝謝,完美的作品。雖然令人討厭,但如果所有東西都可以成爲英文,那將會非常簡單:) – Gnurgen