我寫了一個程序來抓取網站以獲取數據並輸出到Excel表。該程序是使用Microsoft Visual Studio 2010用C#編寫的。去掉Excel表中的非法字符
對於大多數情況下,從網站獲取內容,解析和存儲數據都沒有問題。
但是,一旦我會遇到問題,說有非法字符(如▶
),防止輸出到excel文件,這會導致程序崩潰。 我也手動到網站上,發現其他非法字符,如Ú
。
我試圖做一個.Replace()
但代碼似乎無法找到這些字符。
string htmlContent = getResponse(url); //get full html from given url
string newHtml = htmlContent.Replace("▶", "?").Replace("Ú", "?");
所以我的問題是,有沒有辦法從html字符串中去掉所有這些類型的字符? (網頁的html)下面是我得到的錯誤消息。
我想安東尼和沃茲的解決方案,沒有工作......
Excel允許使用這些字符。 –
@JoelCoehoorn我把這些字符直接放在excel表單中,它沒有問題。我無法通過代碼和程序中斷來實現,我追溯到這是導致問題的字符串,唯一可疑的字符是我的示例中的字符。 – sora0419