我正在尋找一個像HtmlAgilityPack(開源.NET項目:http://www.codeplex.com/htmlagilitypack)的好解析器,但是適用於Python。是否有像HtmlAgilityPack(.NET)for Python這樣的好解析器?
任何人都知道嗎?
我正在尋找一個像HtmlAgilityPack(開源.NET項目:http://www.codeplex.com/htmlagilitypack)的好解析器,但是適用於Python。是否有像HtmlAgilityPack(.NET)for Python這樣的好解析器?
任何人都知道嗎?
使用Beautiful Soup像大家一樣。
Beautiful Soup應該是你要搜索的東西。它是一個html/xml解析器,可以處理無效頁面並允許遍歷特定標籤。
lxml比BS更好地處理無效頁面。使用lxml.html中的css選擇器遍歷標籤更容易。 – aehlke 2009-08-03 20:35:53
此時BS已經成功了lxml。 – aehlke 2009-08-03 20:35:18