2012-01-12 78 views
1

當我試圖找到這個詞的次數在UTF-8字符串,我得到了下一個:UnicodeEncodeError Python的

UnicodeEncodeError 
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-4: ordinal not in range(128) 

這就是我做

tr.words_count = (str(tr.transcribe).count(' ')) 

我需要計算在UTF多少字-8文本,似乎我的方法將無法正常工作。你有什麼想法? 感謝

回答

4
str(tr.transcribe.decode('utf-8')) 

或者更好的是,

unicode(tr.transcribe).count(' ') 

甚至更​​好(以是否有連續多個空格不混淆),

len(unicode(tr.transcribe).split())