3

我尋找一個樣本文本Unicode文件(UTF-8),其可以用於測試與文字編碼和解碼相關的不同的問題,包括:用於測試Unicode相關問題的Unicode示例文本文件?

  • 低ASCII字符的使用,像第一32碼
  • BMP之外的字符
  • NFC相關的問題
  • XML編碼/解碼問題

主要是我要複製的文字到剪貼板,將其粘貼在應用程序的HTML文本區域,並且可以在頁面之後從頁面檢索它。

這將能夠識別解碼,編碼甚至數據庫級別可能出現的不同的Unicode相關問題。

+0

典型表示法:相同但不同的字符串的比較:「û」= u-circumflex或「û」=字母-u +組合 - diacritical-circumflex。 XML 1.1帶有特殊字符的標籤。 – 2013-05-13 10:33:32

+0

此時我需要爲某些人提供一個測試文件,以便他們測試您粘貼的內容將會到達數據庫以及稍後的瀏覽器,因此Unicode比較超出了問題的範圍。 – sorin 2013-05-13 10:39:48

回答

7

本頁面已經被應用於多個腳本來測試Web瀏覽器,與文本:http://www.columbia.edu/~fdc/utf8/index.html

爲「我可以吃玻璃」尤其是BMP之外的哥特項:̈。

標準化表單和XML處理在移動數據時通常沒有問題,因此沒有共同的樣本來測試這兩種數據。