如何在非ISO擴展ASCII英文文本轉換,具有CRLF行終止爲UTF-8在Python文件編碼成UTF-8
1
A
回答
1
擴展Jishiyu的回答,您可以使用uchardet識別字符集。例如
iconv -f `uchardet a_strange_file.txt` -t UTF-8 -o the_output_file.txt a_strange_file.txt
雖然這不在python中完成這項工作。
0
我認爲Linux命令unix2dos,DOS2UNIX的,的iconv會很有幫助。
諸如此類
的iconv -f的Latin-1 -t UTF-8 latin.txt> utf8.txt
0
如果您輸入網絡獲取原始字節流le,那麼你可以decode
它到utf-8
。有些Python 3示例參見this blog post。
0
我已經使用enca庫, 我用我的NAS字幕轉換爲UTF-8中創建一個自動conversion script但它可以用於任何自動轉換
隨意使用:)
編輯:
#!/bin/bash
LANGUAGE=czech
TO=utf8
CONVERT="enca -L $LANGUAGE -x $TO"
# Find and onvert
find ./ -type f -name "*.srt" | while read fn; do
IS_TARGET=`enca "${fn}" | egrep -ow -m 1 'UTF-8|Unrecognized|KOI8-CS2|7bit ASCII|UCS-2|Macintosh Central European'`
if [ "$IS_TARGET" != "UTF-8" ] &&
[ "$IS_TARGET" != "UCS-2" ] &&
[ "$IS_TARGET" != "Macintosh Central European" ] &&
[ "$IS_TARGET" != "Unrecognized" ] &&
[ "$IS_TARGET" != "7bit ASCII" ] &&
[ "$IS_TARGET" != "KOI8-CS2" ]; then
echo "${fn} ---- Will be converted!"
# optional backup of original srt
# cp "${fn}" "${fn}.bak"
$CONVERT "${fn}"
fi
done
+0
你應該在你的答案中包含源代碼,而不是僅僅鏈接到它。 –
相關問題
- 1. Readind utf8編碼的文本文件
- 2. python UTF16LE文件以UTF8編碼
- 3. 在PyCharm中讀取UTF8編碼文件
- 4. Perl編碼 - 將文件保存到UTF8
- 5. C#UTF8編碼
- 6. UTF8編碼/€
- 7. C++ UTF8編碼
- 8. UTF8編碼含+
- 9. php utf8編碼
- 10. utf8和編碼
- 11. UTF8編碼C#Webrequest
- 12. 編碼時爲UTF8
- 13. openshift php utf8編碼
- 14. knitr和UTF8編碼
- 15. UTF8編碼問題?
- 16. UTF8編碼問題
- 17. Grails的UTF8編碼
- 18. UTF8編碼無法解碼
- 19. UTF8 python編碼和解碼
- 20. PHP utf8編碼和解碼
- 21. 更改編碼UTF8到UTF8 BOM與rebol
- 22. Codeigniter電子郵件不編碼爲utf8
- 23. 將電子郵件編碼爲UTF8
- 24. 如何將保存的文本文件編碼轉換爲UTF8?
- 25. PHP&KML文件:如何解碼KML文件中的utf8編碼名稱?
- 26. 轉換ASCII到UTF8編碼
- 27. 不同的utf8編碼?
- 28. MemoryStream的StreamReader UTF8編碼
- 29. Ruby UTF8編碼問題
- 30. Python的編碼ISO爲utf8
但我需要一個Python包,自動轉換爲指定的格式。 – gsivaram