2016-12-14 62 views
0

我有一個包含中文文本的HTML文件。當我在任何網頁瀏覽器中打開文件時,都會顯示缺少的字符。在網絡瀏覽器中查看缺少字符的中文文本編碼

下面是從瀏覽器窗口複製一個例子:

本函旨在邀請您參定於

我知道一個事實,即在這裏看到所有其他字符都正確一邊從缺少的(由一位中國母語人士證實)。

在HTML頭,我有這標誌着該文件標籤包含UTF-8編碼的字符:

<META http-equiv="Content-Type" content="text/html; charset=utf-8"> 

我已經嘗試過在這個元標記的一些其他字符集,但到目前爲止,似乎任何我試着用UTF-8編碼的方法看起來更糟。

我也考慮過它是字體問題的可能性,所以我在我的系統上安裝了3種不同的繁體中文字體,並強制Chrome使用它們。他們沒有任何區別 - 缺少的字符仍然存在。

如果我用記事本打開++的HTML文件,這裏就是我可以看到:

http://i.imgur.com/GoS07WX.png

如果我選擇這個文本複製粘貼到正規MS記事本中,我得到這個:

本函旨在邀請您參與定製

所以你可以在這裏看到記事本++中可見的「xE5 x8A」似乎已被替換爲劦。

在這種情況下瀏覽器會顯示 而不是there有什麼原因嗎?

回答

0

再次查看HTML文件。

我看到的第一個2個字節UTF-8編碼的字符,然後 了......讓我們想象這裏原是一個\ XA0,而這種突變爲&nbsp;當文件被應用全局換人創建UTF-8編碼的數據。

然而,\ xE5 \ x8A \ XA0 UTF-8進行解碼,以U + 52A 這是不一樣的外來字符是U + 52A ...不是足夠接近一個答案。

+0

看起來實際上存在一個涉及生成HTML文件的程序內編碼設置的問題。現在我不再有這個問題,因爲源HTML文件已被更正,謝謝。 – user2539827

相關問題