2014-01-29 53 views
0

我想處理/操縱一些HTML標記在C中處理HTML標記#

例如,

<a id="flFileList_gvDoItFiles_btnContent_1" href="javascript:__doPostBack('flFileList$gvDoItFiles$ctl03$btnContent','')">Untitled.png.3154ROGG635264188946573079.png</a> 

改爲

<a id="flFileList_gvDoItFiles_btnContent_1" href="javascript:__doPostBack('flFileList$gvDoItFiles$ctl03$btnContent','')">Untitled.png</a> 

我要做到這一點,使用C#字符串處理。

對此沒有任何想法。 我寫的邏輯轉換

Untitled.png.3154ROGG635264188946573079.png

Untitled.png

我被困在我該如何識別和標記替換字符串第?

String.Split()?? 
+1

試試這個庫 - > http://htmlagilitypack.codeplex.com/ –

回答

2

我建議你使用HtmlAgilityPack來解析HTML。你可以很容易地通過它的id得到a元素,然後替換它的內部文本:

HtmlDocument doc = new HtmlDocument(); 
doc.LoadHtml(html_string); 
string xpath = "//a[@id='flFileList_gvDoItFiles_btnContent_1']"; 
var a = doc.DocumentNode.SelectSingleNode(xpath); 
a.InnerHtml = ConvertValue(a.InnerHtml); // call your logic for converting value 
string result = a.OuterHtml;