我有一些文件出現在我的Linux系統上。這些文件名可以是其他的un_eng-utf8。我想將它們從非utf8字符轉換爲utf-8字符。我該如何使用C庫函數或Python腳本來做到這一點。將非UTF-8字符轉換爲UTF-8
-1
A
回答
0
2
如果你知道這是用來編碼的文件名中的字符編碼:
unicode_filename = bytestring_filename.decode(character_encoding)
utf8filename = unicode_filename.encode('utf-8')
如果您不知道字符編碼再有就是在一般情況下,沒有辦法做轉換,而不丟失數據 - 「非UTF8」不夠具體例如,如果你有一個包含b'\xae'
字節的話,就可以根據文件名編碼不同的解釋文件名 - 這是cp1252
編碼u'®'
但相同的字節代表u'«'
in cp437
。有模塊,如chardet
,讓你猜字符編碼,但它只是猜測 - "There Ain't No Such Thing as Plain Text."
相關問題
- 1. 將utf8代碼點字符串轉換爲utf8 <U+0161>轉換爲utf8
- 2. 將字節[]轉換爲UTF8字符串
- 3. 將字符串轉換爲utf8字節
- 4. 如何將字符串轉換爲UTF8?
- 5. 將utf8mb4字符轉換爲utf8在php
- 6. 將unicode字符串轉換爲utf8
- 7. 將latin1字符串轉換爲utf8?
- 8. 將字符串轉換爲UTF8與perl
- 9. 將字符串轉換爲UTF8
- 10. 替換非UTF8字符
- 11. 將XML非法&char轉換爲utf8 - python
- 12. 轉換UINT8到字符UTF8
- 13. 將Unicode轉換爲UTF8
- 14. Python將latin1轉換爲UTF8
- 15. 將UTF8轉換爲ANSI?
- 16. 將utf8轉換爲1251
- 17. 將UTF8轉換爲Windows-1252
- 18. 將Utf8轉換爲Unicode
- 19. 將latin1轉換爲UTF8
- 20. 轉換爲UTF8格式的字符串
- 21. Unicode轉換爲UTF8字符串
- 22. 轉換JSON字符串UTF8爲NSDictionary Swift
- 23. 如何將utf8字符串轉換爲ascii字符串?
- 24. 將utf8數據庫中的ansi blob數據轉換爲utf8字符集
- 25. 如何將類似utf8的字符串轉換爲真正的utf8?
- 26. 寫非UTF8字符在Perl
- 27. 取代非utf8字符
- 28. 將字節轉換爲UTF8編碼的字符串安全嗎?
- 29. 如何將UTF8字符串轉換爲字節數組?
- 30. 如何將數字轉換爲UTF8字符?
你知道原始編碼?是否所有字符都以UTF-8格式提供,或者您是否想用相似的字符替換不可用的字詞,忽略它們還是對它們做其他事情? – TobiMarg