2012-11-20 29 views
1

我正在使用c#現在存儲網頁內容的單個變量,如果我粘貼任何能夠顯示完整源代碼鏈接的URL,我就有一個文本框。現在,我想查找所有圖像標記的開始位置和位置它已完成。我還想合併除圖像標籤。如何在使用C#的源代碼中查找圖像標籤?

你能誰能告訴我該怎麼做..

+0

我已經從標籤中刪除ASP.NET,MVC和經典ASP。這與任何這些技術無關。 –

+0

[我如何使用HTML Agility Pack從網站檢索所有圖像?](http://stackoverflow.com/questions/2113924/how-can-i-use-html-agility-pack-to -Retrieve-all-the-images-from-a-website) –

+0

我認爲他希望標記圖片標籤的起始位置和結束位置在html文本中;查找部分是重複的,但不一定需要是HtmlAgilityPack,而巧合的是,我實際上認爲這將是定位標籤的最佳方式。我們應該專注於回答他要求如何找到標籤的開始和結束的部分。有點奇怪,因爲'img'標籤不一定有結束標籤。 –

回答

3

假設你需要解析的內容服務器端,你可以使用HTML敏捷包

this問題

+0

只記得在鏈接問題中圖像的src被定位,而你的問題在這裏要求標籤自己。除非,當你說你想存儲你的意思是下載的圖像以及HTML,在這種情況下,你會需要兩個。 –

1

試試這個:

var images = doc.DocumentNode.SelectNodes("//img"); 
if (images != null) 
{ 
    foreach (HtmlNode image in images) 
    { 
     var alt = image.GetAttributeValue("alt", ""); 
     var nodeForReplace = HtmlTextNode.CreateNode(alt); 
     image.ParentNode.ReplaceChild(nodeForReplace, image); 
    } 
} 

var sb = new StringBuilder(); 
using (var writer = new StringWriter(sb)) 
{ 
    doc.Save(writer); 
} 
相關問題