閱讀HTML身體下面我有HTML
文件,它包含的內容象下面這樣:垃圾的價值,同時使用C#
<HTML>
<BODY>
...
........ company's Chief Financial Officer. Now the.......
...
</BODY>
</HTML>
我使用閱讀本文件的內容:
StringBuilder stringBuilder = new StringBuilder();
using (StreamReader sr = new StreamReader(filePath))
{
String line = sr.ReadToEnd();
stringBuilder.Append(line);
}
strFileContent = stringBuilder.ToString();
但是它返回字符串爲:
........company sChief FinancialOfficer. 現在..... ..
HTML
文件在我的本地系統中。
什麼是文件的編碼?嘗試明確指定編碼,否則'StreamReader'將默認爲'UTF8'。 – 2014-10-29 06:43:02
@ Sriram,目前的編碼是charset = windows-1252。我認爲這是造成問題 – Aquarius24 2014-10-29 06:50:32