HTMLAgilityPack和分離<br/>

html-agility-pack

2011-05-23 26 views 1 likes

我有一些HTML，這是由<br/>例如爲：HTMLAgilityPack和分離<br/>

Jack Janson 
<br/> 
309 123 456 
<br/> 
My Special Street 43

什麼是檢索在3列中的信息最簡單的方法分離？

我不是XPath專家，所以另一種方法是將行分隔符上的字符串分開，並且只使用數組。有沒有更聰明的方法來做到這一點？

更新：忘了格式化代碼。

來源

2011-05-23 Dofs

請張貼的HTML的一個例子。 – 2011-05-23 20:46:30

回答

在基於XML的純XPATH，你會使用XPath表達式是這樣的：//preceding-sibling::br或//following-sibling::br（見這裏尋求幫助的XPATH Axes）

但是，在XPATH在HTML實現，你會以HTML敏捷性包找到在XPATH選擇表達式中不支持純文本節點或（屬性節點）（例如，//br/text()或//br/@blah不起作用）。注意它適用於過濾器，因此，這些//br[text()='blah']或//br[@att='blah']工作。

所以，回到這個問題，你需要XPATH和代碼，像這樣結合：

HtmlDocument doc = new HtmlDocument(); 
doc.Load(myHtmlFile); 

foreach (HtmlNode p in doc.DocumentNode.SelectNodes("//br")) 
{ 
    Console.WriteLine(p.PreviousSibling.InnerText.Trim()); 
}

這將輸出

Jack Janson 
309 123 456

來源

2011-05-24 06:57:53

相關問題

1. HtmlAgilityPack HtmlNode如何獲得<select>和<option>標籤
2. 重載<<運算符，分離的執行和刪除
3. PowerShell和HtmlAgilityPack
4. 和/或在HtmlAgilityPack
5. HtmlAgilityPack和HtmlDecode
6. 剝離HTML標籤而不使用HtmlAgilityPack
7. HTMLAgilityPack和XPath目標
8. HtmlAgilityPack和php標籤
9. HtmlAgilityPack和Windows 8 winRT
10. HtmlAgilityPack錯誤的解析<輸入

11. 跳過<！DOCTYPE HTML>與htmlAgilityPack
12. 分離HTML和JS
13. 分離行和JSP
14. 分離MXML和Actionscript
15. 如何用C＃和HTMLAgilityPack將<table>轉換爲'onmouseover'事件
16. 在jQuery中分離<tr>
17. HtmlAgilityPack和大的HTML文檔
18. HtmlAgilityPack節點和子節點
19. HTMLAgilityPack和加載超時
20. 代理和htmlagilitypack問題
21. HtmlAgilityPack和屬性最小化
22. 分離TypeScript和JavaScript文件
23. JFrame和JPanel分離問題？
24. Lua和C++：職責分離
25. 邏輯和UI的分離
26. VB.NET的RichTextBox和TextBox分離
27. ORM的分離和驗證
28. Erlang ETS原子和分離
29. 在瓶分離HTML和JavaScript
30. 後臺和前端分離