我試圖閱讀使用python ftfy庫混合編碼類型的文本。該庫提供良好的結果時文本不混合即使用兩種不同的編碼類型使用ftfy讀取文本
>>> print(ftfy.fix_text('ünicode'))
ünicode
但如果文字是混合然後得到這樣的事情即
>>> print(ftfy.fix_text('Hi to ℙℽ☂ℌϕℿ ünicode'))
ℙℽ☂ℌϕℿ ünicode
這東西,這個庫不能處理?有什麼方法可以閱讀混合編碼類型的文本?另外我會做一些關於python和unicode的瞭解,但是沒有找到好的例子,當文本具有不同的編碼類型時如何處理。
謝謝你讓我知道這個庫,順便說一句! – lenz
是的,這是看起來很有用的圖書館...... – ShadoW