2012-09-05 216 views
1

我想解析一個html頁面並從中獲取特定值。我如何使用Linq或C#中的字符串解析來做到這一點?Linq解析html字符串

-------------更多HTML ----------

 <span class="date"> 
     04.09.2012 
    </span> 
    <table cellspacing="0"><tr><th scope="row">1 EUR</th><td><span>**4,4907**</span></td><td><span class="rise">+0,0009</span></td><td><span class="rise">+0,02%</span></td></tr><tr><th scope="row">1 USD</th><td><span>3,5635</span></td><td><span class="fall">-0,0093</span></td><td><span class="fall">-0,26%</span></td></tr></table> 

-------------更多HTML ----------

我有興趣獲得價值4,4907以粗體顯示!

任何想法如何實現這一目標?

謝謝!

+2

使用'Html Agility Pack' – adatapost

+2

是的,使用[Html Agility Pack](http://htmlagilitypack.codeplex.com/)。 Linq在這裏沒有業務,字符串解析將是一場噩夢 – Steve

回答

1

試圖解析HTML時要小心。

我認爲顯而易見的方法是將其加載到XDocument(作爲XML),但是由於HTML通常是不明確的或者包含語法錯誤,所以這肯定會失敗。

這裏的人在堆棧溢出,而不是建議使用http://htmlagilitypack.codeplex.com/這被認爲是一個偉大的工作解析HTML。然後你可以使用xpath來查詢你的文檔中的各種內容。