目前我有一個用python編寫的簡單IRC bot。Python IRC bot和編碼問題
由於我將它遷移到python 3.0中區分字節和unicode字符串,我開始有編碼問題。具體而言,其他人不發送UTF-8。
現在,我可以告訴所有人發送UTF-8(他們應該不管),但更好的解決方案將嘗試讓Python默認爲其他編碼或類似。
到目前爲止,代碼如下所示:
data = str(irc.recv(4096),"UTF-8", "replace")
至少不會拋出異常。但是,我想要通過它:我想讓我的機器人默認爲另一種編碼,或嘗試以某種方式檢測「麻煩的字符」。
此外,我需要弄清楚這個mIRC實際使用的神祕編碼是什麼 - 因爲其他客戶端似乎能正常工作併發送UTF-8。
我應該如何去做這些事情?
cp1252將始終顯示爲適用於任何非零字節序列,因爲它將代碼點分配給除零以外的每個字節值。 – RichieHindle 2009-06-02 13:37:01