2010-08-25 64 views
1

我正在尋找純粹的Ruby(或Java)解決方案來美化HTML代碼。使用Ruby或Java美化HTML代碼?

由於Nokogiri和其他HTML解析器需要外部C程序,我目前使用Hpricot來解析HTML。我假設我可以使用Hpricot清理HTML,如果我能想出一個好的算法。如果這已經完成,我不希望重蹈覆轍。

+0

與HTML仍然是一個值得商榷的問題,其中包括專業程序員的Ruby集成看一看這個[紅寶石論壇](HTTP。: //www.ruby-forum.com/topic/1457449)。 – zearth 2011-08-04 02:59:36

回答

1

也許你可以試試jtidy?

http://jtidy.sourceforge.net/

「JTidy是HTML整潔,一個 HTML語法檢查和漂亮 打印機的一個Java端口。就像它的非Java表弟, JTidy可以作爲 工具清理格式不正確和錯誤的HTML。 此外,JTidy提供了一個DOM 接口是 被處理,從而有效地 使你能夠使用JTidy的DOM解析器 現實世界的HTML文檔。

JTidy是由Andy Quick編寫的,後者 後來從維護者 的位置下臺。現在,JTidy由一組 志願者維護。

上JTidy更多信息可在JTidy SourceForge項目頁面 上找到 「