tidy

    4熱度

    2回答

    我正在嘗試使用JTidy來執行XHTML DOM解析,而這看起來相當違反直覺。特別是,有解析HTML的方法: Node Tidy.parse(Reader, Writer) 而得到<體/節點的>,我想,我應該使用 Node Node.findBody(TagTable) 我應該從哪裏得到的是一個實例TagTable? (構造函數被保護,並且我還沒有找到工廠來生成它。) 我使用JTidy 8

    0熱度

    1回答

    在.net網絡應用程序中,我與第三方CMS api進行了交談,該API給出了html。我需要將它轉換爲格式良好的xml,所以我使用了一個圍繞HTML tidy的.NET包裝。這會生成一個很好的DOM,但在使用字符如 時會出錯。 我需要那些被轉換爲他們的代碼格式,如 爲了讓XmlDocument接受它。 除了使其成爲XHTML之外,無法在整潔包裝上設置更多選項。所以在返回字符串的

    2熱度

    1回答

    是否有一個Perl模塊,可以採取錯誤的HTML(如從微軟Word複製)並將其解析爲格式良好的HTML?我曾看過HTML :: Tidy,但已獲得horrible reviews on CPAN。我們有一個自定義遺留模塊,它基本上是tidy命令行版本的包裝器(它似乎幾乎是HTML :: Tidy),但它將文件寫入磁盤並將其讀回,這可能是一個很大的性能罰款。當然,用Perl的真棒文本解析能力,還有更好

    2熱度

    1回答

    我正在使用PHP 5 Tidy類來格式化html。 一切都很好,除非它傳遞一個樣式屬性,當它將其更改爲類屬性時。由於我只是格式化文檔的正文,而不是正文,所以在頭部沒有定義要爲屬性讀取的類。 我已經查看了所有整潔選項,但無法解決如何阻止此行爲。 感謝