我使用HTML敏捷性包被(儘可能多的建議在這裏)有一段時間,我喜歡它,但我有一些顧慮。淨HTML解析器現在和未來
我正在開發一些新的應用程序,這些應用程序在(X)HTML分析上應該會運行數年,所以我想依賴一個似乎與日常的網絡混亂保持一致的庫。 我這樣說是因爲前段時間我從HAP開發人員那裏看到一篇文章,指出他們在不久的將來會遇到問題,並且應該做些改變,但由於缺乏資源而難以完成。我asked in their Codeplex和它的維護者可能確認他們想要做什麼,他們有多少時間,我完全理解。
看看其他選項,Majestic 12 parser似乎是人們在這裏推薦的另一個很好的選擇...但它的網站快速訪問告訴我們它的最後版本日期爲2008年,現在超過3年。
那麼請問...有誰知道一個良好的.Net HTML解析器似乎有它背後強大的開發,從而能夠適應任何需要以下年?它也必須是開源的。也許我要求太多......但以防萬一。
不要誤解我的意思,我喜歡HAP,我現在對它很滿意,我只是害怕在一段時間內會發生什麼事情,並且在依靠深入持久的東西之前,我更願意探索可用選項。
謝謝!
因此,不要依賴HAP,而要依靠別的東西?如何在沒有水晶球或時間機器的情況下爲這個問題提供答案? –
@R:至少OP不提倡正則表達式。 ;) – TrueWill
@TrueWill,是的,但是他主張黑魔法,這是更糟糕的:-) –