我已經切換了Python 3.6現在,但是當運行內容豐富的功能時,我試圖在我的特徵提取器中打印俄羅斯時,結束了胡言亂語。內容豐富的功能不返回西里爾字符
Most Informative Features
three_last_letters = 'оÌ' noun : verb = 6.6 : 1.0
three_last_letters = 'гÐ' noun : verb = 5.4 : 1.0
three_last_letters = 'еÐ' noun : verb = 4.7 : 1.0
three_last_letters = 'мÐ' noun : verb = 4.4 : 1.0
three_last_letters = 'нÑ' noun : verb = 3.5 : 1.0
在特徵提取本身
def POS_features(word):
return{'three_last_letters':word[-3:]}
print(POS_features(u'Богатир'))
我能得到тир打印就好了的情況下,是有什麼我可以做,以使信息量大的特點返回俄語字符?
關於什麼操作系統?並且你是否在控制檯或IDE中嘗試打印? – dima
我在Windows上的Jupyter筆記本上編碼。 – reivermello
如果Python 3.5沒有這種情況,那可能是因爲這種改變:「PEP 528和PEP 529,Windows文件系統和控制檯編碼更改爲UTF-8」。對不起,沒有合適的解決方案,但嘗試嘗試'sys.setdefaultencoding'並檢查'sys.stdout.encoding'。 – drdaeman