2014-02-27 31 views
0

我正在使用HTML Tidy清理HTML文件,以及稱爲TidyManaged的.NET版本,並且我的「£」符號正在轉換爲「?」£轉換爲?通過HTML Tidy,EncodingType?

即:

Income (£) 

變爲:

Income (�) 

我相信這是與編碼類型做。在TidyManaged中,可以指定輸入編碼類型和輸出編碼類型,包括諸如Latin1,utf8,utf16,win1252之類的內容。

XHTML文檔將最終轉換爲使用win1252的DOC。

那麼我的輸入和輸出編碼應該保留£符號?

非常感謝。

+1

可以將其更改爲的HTML實體? –

+1

找出html文件的編碼並將其用作輸入編碼,並使用任何你想要的作爲輸出編碼。 – Musa

+1

£是英鎊符號的HTML代碼。如果你只是像往常一樣輸入它,有時你會得到問號,因爲編碼是不同的。 –

回答

1

那麼,當我使用其他字符集時,它總是不同的。我不熟悉他們,但我知道要創建符號,標點符號需要使用'代碼'而不是文字。從未見過win1252,但谷歌說這是0x00A3

試着把它放在文檔的某個地方。

我知道在HTML我會把£英鎊的跡象。所以HTML:

<p>&#163;0.00</p> 

Where I got the code