2011-06-05 75 views
1

我的html此位,我需要解析雖然使用HTML Agility Pack在圖片旁邊獲取文字?

<p class="feature_list"> 

<img src="candy.gif" alt="candy" title="candy"/>&nbsp; 
         x 3&nbsp;&nbsp; 
<img src="lollies.gif" alt="lollies" title="lollies"/>&nbsp; 
         1&nbsp;&nbsp; 
<img src="system.gif" alt="system" title="system"/>&nbsp; 

         x 1&nbsp;&nbsp; 
<img src="phone.gif" alt="phone" title="phone"/>&nbsp; 
         x 1&nbsp;&nbsp; 
</p> 

,你可以看到有一個圖像,然後像「×3」旁邊的文本。

我想要做的是遍歷每個圖像,並記錄旁邊的文本。但是,該文本不在'img'標籤之內。

我想知道是否有使用HTML敏捷包做這件事?

回答

4

下面的代碼:

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument(); 
    doc.Load(yourHtml); 

    foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//img")) 
    { 
     Console.WriteLine(HtmlEntity.DeEntitize(node.NextSibling.InnerText).Trim()); 
    } 

將輸出:

x 3 
1 
x 1 
x 1 

注意HtmlEntity工具,簡化了HTML實體的處理(如&nbsp;

相關問題