解析純文本使用XPath

2014-10-28 80 views -2 likes

-2

... 
Registrant Email: [email protected] 
... 
Admin E-mail:[email protected]

我嘗試投入htmlagilitypack此挑選出所有的電子郵件地址，電子郵件地址，但沒有結果恢復

var doc = new HtmlAgilityPack.HtmlDocument(); 
doc.LoadHtml(html); 
var emails= doc.DocumentNode.SelectNodes("//*[contains(text(), '@')]");

來源

2014-10-28 nam vo

你不能在沒有HTML標記文件中使用磁帶庫。事實上，你不能在純文本上使用任何XML/XSLT/XPath工具。我建議使用C＃級別的正則表達式從文件中提取郵件地址。 – 2014-10-28 11:00:50

回答

你不會如果你的文本文件只包含純文本，就可以用Xpath來完成。
試試這個：

private static List<String> ExtractMailsFromFile(string filename) 
    { 
     string data = File.ReadAllText(filename); 
     Regex emailRegex = new Regex(@"[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*@(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?", RegexOptions.IgnoreCase); 
     MatchCollection emailMatches = emailRegex.Matches(data); 
     return (from Match emailMatch in emailMatches select emailMatch.Value).ToList(); 
    }

來源

2014-11-04 14:05:17 MrMAG

相關問題

11. 有效地解析純文本
12. javascript純文本網址解析
13. iOS PDF到純文本解析器
14. 使用XPath解析XML文檔
15. 解析XML文檔使用XPATH？
16. 使用HtmlAgilityPack-Xpath解析HTML文檔，RegExp
17. 使用XPath解析XML
18. 解析XML使用XPath的
19. 解析使用GDataXML與XPATH
20. Android - 使用XPath解析XML
21. 使用XPath/XMLHttpRequest解析HTML
22. 使用Xpath解析HTML
23. 使用xpath shell解析xml
24. 使用XPATH解析XML
25. 使用lxml xpath解析
26. 如何使用Jericho HTML解析器遍歷純文本段
27. php xpath解析腳本src
28. 使用xpath解析錨標記內的文本
29. 使用XPath解析HTML中的文本時出現錯誤
30. 將純文本列表解析爲多個文本文件