0
有沒有簡單的方法來統計HTML文件中的節點?我還需要計算某些類型的節點,例如div等計算HTML文件中的所有節點
我希望儘可能地做到這一點,而不必使用HTMLAgilityPack等外部庫(如果可能)。此外,我正在處理的HTML不能保證格式正確和有效。
有沒有辦法從C#做到這一點?
謝謝。
有沒有簡單的方法來統計HTML文件中的節點?我還需要計算某些類型的節點,例如div等計算HTML文件中的所有節點
我希望儘可能地做到這一點,而不必使用HTMLAgilityPack等外部庫(如果可能)。此外,我正在處理的HTML不能保證格式正確和有效。
有沒有辦法從C#做到這一點?
謝謝。
節點在這裏是指像,父級節點或一切即甚至嵌套的像
如果您有XHTML,則可以將其加載到XDocument中,並使用XML操作API或LINQ to XML來計算特定模式。
如果你不這樣做,你可以嘗試使用正則表達式。但是這個工作在少數有趣的標籤中,因爲你必須爲每個標籤手動定義一個表達式。
來源
2011-11-06 18:13:54 ViktorZ
使用LinqToXml API,您可以輕鬆解析並循環瀏覽HTML文檔的所有節點。您可以找到與LinqToXml相關的有用文章,但都是在解析XML文檔的情況下。
以下是從StackOverflow的一個類似的線程:C# Is there a LINQ to HTML, or some other good .Net HTML manipulation API?
來源
2011-11-06 18:16:25