tidy

4熱度

2回答

我正在嘗試使用JTidy來執行XHTML DOM解析，而這看起來相當違反直覺。特別是，有解析HTML的方法： Node Tidy.parse(Reader, Writer) 而得到<體/節點的>，我想，我應該使用 Node Node.findBody(TagTable) 我應該從哪裏得到的是一個實例TagTable？（構造函數被保護，並且我還沒有找到工廠來生成它。）我使用JTidy 8

0熱度

1回答

如何轉換所有html轉義字符在一個整潔的xhtml字符串，所以它加載在一個XmlDocument？

在.net網絡應用程序中，我與第三方CMS api進行了交談，該API給出了html。我需要將它轉換爲格式良好的xml，所以我使用了一個圍繞HTML tidy的.NET包裝。這會生成一個很好的DOM，但在使用字符如時會出錯。我需要那些被轉換爲他們的代碼格式，如爲了讓XmlDocument接受它。除了使其成爲XHTML之外，無法在整潔包裝上設置更多選項。所以在返回字符串的

2熱度

1回答

從Perl中的富文本編輯器解析HTML的最佳方式是什麼？

是否有一個Perl模塊，可以採取錯誤的HTML（如從微軟Word複製）並將其解析爲格式良好的HTML？我曾看過HTML :: Tidy，但已獲得horrible reviews on CPAN。我們有一個自定義遺留模塊，它基本上是tidy命令行版本的包裝器（它似乎幾乎是HTML :: Tidy），但它將文件寫入磁盤並將其讀回，這可能是一個很大的性能罰款。當然，用Perl的真棒文本解析能力，還有更好

2熱度

1回答

整潔轉換<span style =「font-style：bold」>到<Class="C1">

我正在使用PHP 5 Tidy類來格式化html。一切都很好，除非它傳遞一個樣式屬性，當它將其更改爲類屬性時。由於我只是格式化文檔的正文，而不是正文，所以在頭部沒有定義要爲屬性讀取的類。我已經查看了所有整潔選項，但無法解決如何阻止此行爲。感謝