2010-04-14 50 views

回答

1

我不能爲我的生活捉摸爲什麼你會試圖做到這一點,但你可能想看看HTML Agility Pack

「這是一個靈活的HTML解析器 建立一個讀/寫DOM,並支持 普通的XPATH或XSLT(你實際上 不需要理解XPATH,也不需要 XSLT來使用它,不用擔心...)。它是一個.NET代碼庫允許您將 解析爲「超出網絡」的HTML文件。 解析器非常容忍機智h「真實 世界」格式錯誤的HTML。對象 模型非常相似,提出 的System.Xml,但對HTML文件(或 流)。」

+0

我知道,這沒什麼共同之處。這是爲了進口/出口的目的。 – 2010-04-14 19:28:51

+0

剛剛檢查過它。這是一個不錯的圖書館。雖然它不適合解析aspx。也許有一些修改。 – 2010-04-14 19:49:20

1

DMS Software Reengineering Toolkit可以解析C#,無論是作爲全文件和片段(例如,東西在< %%>括號內),並且可以以乾淨和髒的格式(你在HTML文件中真正看到的東西)解析HTML。DMS自動生成樹(「DOM模型」),用於解析它。

With minor一點點的努力和HTML方言<%>很容易定義,然後可以解析ASPX文件。我們已經爲PHP做了本質的工作。

+0

我認爲這將是一個很好的解決方案。但目前這是昂貴的。 – 2010-04-20 14:55:23