3
我尋找一個樣本文本Unicode文件(UTF-8),其可以用於測試與文字編碼和解碼相關的不同的問題,包括:用於測試Unicode相關問題的Unicode示例文本文件?
- 低ASCII字符的使用,像第一32碼
- BMP之外的字符
- NFC相關的問題
- XML編碼/解碼問題
主要是我要複製的文字到剪貼板,將其粘貼在應用程序的HTML文本區域,並且可以在頁面之後從頁面檢索它。
這將能夠識別解碼,編碼甚至數據庫級別可能出現的不同的Unicode相關問題。
典型表示法:相同但不同的字符串的比較:「û」= u-circumflex或「û」=字母-u +組合 - diacritical-circumflex。 XML 1.1帶有特殊字符的標籤。 – 2013-05-13 10:33:32
此時我需要爲某些人提供一個測試文件,以便他們測試您粘貼的內容將會到達數據庫以及稍後的瀏覽器,因此Unicode比較超出了問題的範圍。 – sorin 2013-05-13 10:39:48