2012-03-08 46 views
1

字符編碼我有一個字符串,我知道程度符號(°)由字節63(3F)表示。發現從字節

每個字符由一個字節表示。

我怎樣才能找到使用的字符編碼?

+0

也許該字節實際上是字符'?' (字節63),因爲我提取數據的odbc驅動程序不知道如何表示字符並用'?'替換它。 – Sebtm 2012-03-08 12:45:32

+0

你怎麼知道字節0x3F對應於U + 00B0 SIGNREE?我有一個工具可以可靠地識別文本文件的8位編碼,但它需要超過一個字節才能完成。它有一個語言模型在幾個非常大的英語語料庫上訓練,對這樣的文本也很好(> 99%的準確性)。如果不是英語,您可以(也應該)爲不同的語言使用不同的模型。 – tchrist 2012-03-08 15:01:36

+0

我知道它是學位符號。只有我不知道字符編碼。 – Sebtm 2012-03-08 16:00:01

回答

1

現代時代幾乎所有的8位編碼都與ASCII範圍內的ASCII碼一致,因此字節3F十六進制是問號「?」。正如Sebtm的評論所暗示的,這可能是由字符級數據錯誤造成的。例如,一些限於ASCII的軟件可能會將所有其他字節變成「?」 - 這不是一個好習慣,但可能。

如果它是非ASCII字節,則可以使用頁面http://www.eki.ee/letter/chardata.cgi?search=degree+sign進行猜測。