2013-08-21 71 views
0

什麼是最好的方法(數組,列表,Streamwriter或字典)來隱藏解析html innerTextinnerhtml(URL),以便它可以被轉換成XML。最好的方法來存儲解析的HTML輸出在XML

這是我試圖寫的第一個程序,沒有幫助,但我堅持這一點。我沒有在這個問題中添加任何代碼,所以我可以學習如何自己做。任何人可以給任何建議將不勝感激。

+3

不知道我是否正確理解你,但爲什麼不將它存儲爲'string',然後使用'XElement.Parse()'使它成爲一個XML對象。 – gunr2171

+0

使用Html Agility Pack解析HTML,然後將其寫爲有效的XHTML。 http://htmlagilitypack.codeplex.com/ ... http://stackoverflow.com/questions/6446525/c-sharp-html-from-webbrowser-to-valid-xhtml –

回答

2

string因爲HTML很少有效的XML,你需要通過一個專門的分析器運行它到嘗試儘可能多地把它放到XML表單中。

但假設你能夠解析它,字符串和XML之間的中間會有某種自定義樹結構。在.NET中沒有內置的樹形結構,但這很容易創建,谷歌會指向你十億個教程。