0
A
回答
0
我懷疑是否有任何像樣的解決方案。我會盡力解釋。如果您或多或少知道應該在文件中,您只能定義編碼。然後,您可以嘗試猜測轉換文件的不同方式,並檢查結果是否與您預期的相似。如果你以俄羅斯編碼表爲例。你有所有類型的變化,如KOI-8,CP1251,CP866,它不是結束=)。所有這些編碼都有不同的俄羅斯符號映射,所以如果你拿一個文本文件並閱讀它認爲錯誤的編碼,而不是適當的數據,你會有從絕對不同的字母形成的單詞,雖然單詞/空格和較低的ASCII表部分將看起來絕對精細。
關於UTF8/16等你不能檢測到它,但你可以檢查輸入文件裏面沒有非法序列,所以你可以嘗試使用特定的編碼來對待它。
我認爲最好的選擇將首先嚐試定義您計劃檢測的編碼子集,並根據特定標準設計檢測算法。
相關問題
- 1. C編程讀取文本文件
- 2. 在C++中讀取未知編碼的文本文件
- 3. 讀取編碼爲[ANSI]的C#文本文件
- 4. 用C讀取UNIX編碼的文件#
- 5. 如何根據文件編號在java中讀取文件?
- 6. C編程讀取文件
- 7. C#從讀取文本文件中讀取二進制文件
- 8. 編碼錯誤讀取CSV文件(UNICODE編碼)C++
- 9. 如何根據名字讀取文本文件?
- 10. Python支持根據DTD編碼文本
- 11. 寫入/讀取文本文件(C#)
- 12. 從C#中的文本文件讀取#
- 13. C#實時讀取文本文件
- 14. c中讀取的文本文件#
- 15. C++從文本文件讀取雙行
- 16. 從文本文件中讀取。 C++
- 17. C++/cli讀取文本文件
- 18. 用c讀取文本文件
- 19. 在C++中讀取文本文件
- 20. 使用C++讀取文本文件
- 21. 從文本文件中讀取objective-c
- 22. 從文本文件逐行讀取C++
- 23. C#:從文本文件讀取枚舉
- 24. 從文件中讀取文本c
- 25. C++文本文件讀取性能
- 26. C#查詢(從文本文件讀取)
- 27. C++從文本文件讀取雙打
- 28. C從文本文件中讀取值
- 29. 從C中的文本文件讀取
- 30. 嘗試讀取文本文件C++