11
A
回答
8
我在過去已經使用了HTMLAgilityPack,但取得了一些成功,但它解析了HTML格式嚴重不足或缺少結束標記的問題。不過那是大約2年前。
我通常傾向於SGMLReader,它允許您用XML Reader包裝它,因此您可以在C#中輕鬆使用XDocument或XmlDocument來讀取HTML。 SGMLReader已經處理了我所投入的所有格式錯誤的HTML。
相關問題
- 1. 類似於BeautifulSoup和「HTML敏捷包」但C或Java的庫?
- 2. 類似於C
- 3. BeautifulSoup和ASP.NET/C#
- 4. 類似於C++的printf
- 5. 類似Javadoc的C++文檔
- 6. 類似於ORM的庫C
- 7. BeautifulSoup從類
- 8. BeautifulSoup - 拼錯類
- 9. 類似的Objective-C在C++中的KVO
- 10. C++中的類似拼接類似Javascript中的拼接?
- 11. 類似於C#.NET中的類似於java的通用列表
- 12. Python BeautifulSoup類似divs在同一容器排序
- 13. BeautifulSoup:類似。頭(東西)函數在熊貓
- 14. 與C++類似的C#cast reinterpret_cast
- 15. 類似於C#的C++庫嗎?
- 16. C++中類似C#的事件,作文
- 17. 在C++中複製類似的類
- 18. C++從類似的虛擬公共類
- 19. C#類類似於Java Desktop類
- 20. 與beautifulsoup多個類
- 21. 替換類名BeautifulSoup
- 22. BeautifulSoup類型錯誤
- 23. C++編碼類似網站
- 24. C#API POST類似於CURL
- 25. C中的類似Grep的過濾器?
- 26. 類似的功能在C#中的String.Format
- 27. C++中的類似Python的多處理
- 28. C++中的類似於Haskell的`const`
- 29. C#的類似Python的字典聲明?
- 30. C++的類似Maven的依賴管理?
我之前簡單地使用了這個(大約5/6年前!?)http://htmlagilitypack.codeplex.com/,它對我所需要的東西沒有問題 - 但從來沒有對它進行廣泛的測試,它的步伐... –
http://developer.mindtouch.com/SgmlReader 我以前用這個解析HTML。這是非常可靠的相當可疑的HTML – Pete