是否有正確的方法來檢測Windows-1251
編碼字符?如何檢測Windows-1251編碼字符
IMO,不同於多字節本機字符,Windows-1251
是一個8位的字符編碼,所以它不可能從其它8位本地字符像latin1
區分。如果我錯了,請糾正我。
第一條線索對我來說是locale
,我把所有的non-ascii
字符Windows-1251
如果語言環境是ru
。
有沒有更好的方法?
UPDATE:
這裏是我的問題的情況下,也有一個MP3文件的ID3
信息有些Windows-1251
編碼的字符,我必須檢測Windows-1251
編碼的字符,然後使用它們轉換爲UTF-16 icu4c
,否則這些Windows-1251
編碼的字符將在我的系統(Android
)上顯示爲不可讀。我認爲也許你們有更好的方法。
你想從中發現什麼? –
某些MP3文件在Windows-1251中編碼的ID3標籤中具有西里爾文字符。 – Alan
因此,您希望能夠拍攝MP3文件並辨別ID3標籤是否在1251中編碼? –