是否有一個用於python的綜合字符替換模塊,用於在字符串中查找所有非ascii或非Unicode字符並用ascii或unicode equivilents替換它們?在編碼或解碼過程中,這種「忽略」參數的這種安慰是瘋狂的,但同樣也是'?'在每個非翻譯角色的地方。用於非Unicode和非ASCII的Python中的綜合字符替換模塊
我正在尋找一個模塊,它會發現令人厭惡的字符,並使其符合任何標準要求。 我意識到,現存的字母和編碼的數量使得這有點不可能,但肯定有人對它進行了刺探?即使是一種基本的解決辦法也會比現狀好。
這意味着數據傳輸的簡化是巨大的。
爲什麼看任何硬個性和猜測它的編碼? –
@ x-y,因爲相同的代碼可以用於完全不同的語言。隨着更多的信息,它可能會更容易,但。 –