2011-02-18 28 views
0

我有一個python腳本作爲顛覆pre-commit鉤子,和我遇到的一些問題,在提交郵件UTF-8編碼的文本。例如,如果輸入字符是「å」,則輸出是「?\ 195?\ 165」。用相應的字節值替換那些字符部分最簡單的方法是什麼?正則表達式不起作用,因爲我需要對每個元素進行處理並將它們合併回去。如何解決編碼錯誤的字符串在python

代碼示例:

infoCmd = ["/usr/bin/svnlook", "info", sys.argv[1], "-t", sys.argv[2]] 
info = subprocess.Popen(infoCmd, stdout=subprocess.PIPE).communicate()[0] 
info = info.replace("?\\195?\\166", "æ") 
+2

如果您發佈導致問題的代碼,它可能會有所幫助。 – 2011-02-18 16:28:42

回答

1

我做同樣的事情在我的代碼,你應該能夠使用:

... u_changed_pa​​th =的Unicode(changed_pa​​th, 'UTF-8') ...

當使用上述的辦法,我只能用字符,如換行和這樣遇到問題。如果你發佈了一些代碼,它可能會有所幫助。

相關問題