我正在寫一些郵件處理軟件在Python中遇到頭字段中的奇怪字節。我懷疑這只是格式錯誤的郵件;該消息本身聲稱是us-ascii,所以我不認爲有真正的編碼,但我希望得到一個近似於原始字符串的unicode字符串,而不拋出UnicodeDecodeError
。是否有一個Python庫函數試圖猜測某些字節的字符編碼?
所以,我正在尋找一個功能,需要str
和可選的一些提示,並做它的最殘酷的回報unicode
。我當然可以寫一個,但是如果存在這樣的功能,它的作者可能會想到更深入的瞭解這個最好的方法。
我也知道Python的設計更喜歡顯式隱式,並且標準庫的設計是爲了避免在解碼文本時產生隱含的魔力。我只想明確地說「繼續前進」。
+1比我快5秒:-) – 2008-11-06 15:27:45
真的很有用,謝謝。但不在標準庫中。 – Nick 2008-11-07 21:03:47