我有一個程序輸入文本並使用多種函數對其進行排序,並且文本應該可讀取而不管格式如何,但是,當導入保存爲擴展ASCII編碼的文件時,任何超過127的字符都會被忽略。環顧四周,我似乎無法看出如何克服這一點。這些文件在UTF-8和Unicode中都能正常讀取。我已經嘗試將字符串轉換爲UTF-8,但是有問題的字母仍然只是以問號形式出現,而不是形狀。我可以看到這些值是正確的:0xBF表示û,但它們不被解釋爲值。轉換擴展ASCII/ANSI值
任何人都可以幫助我,我之前沒有做過很多這方面的工作。如果有幫助,我正在C#中工作。
我轉換這個樣子的當前代碼:
System.Text.UTF8Encoding u = new System.Text.UTF8Encoding();
byte[] asciiBytes = Encoding.UTF8.GetBytes(sd);
sd = u.GetString(asciiBytes);
哪裏sd
是字符串。當我輸入這串,我不指定文本編碼:
string input = File.ReadAllText(fname);
...
parser(input);
如果您發佈了一些代碼,我們可以指出錯誤。還要具體說明所使用的編碼和I/O。 –