2
我正在使用JTidy(HTML Tidy庫的Java端口)來清理一些現有的網站。當我使用我的JTidy配置似乎是非常嚴格的,並最終切斷頁面的底部(壞標記)。W3C HTML Validator使用JTidy(HTML-Tidy)配置
當我通過w3c HTML驗證器工具運行相同的標記時,它會清理它,但在重寫時更加智能;而不是剔除標籤,它似乎智能地猜測缺失標籤的位置,並相應地更新結構。
有誰知道HTML-Tidy配置w3c使用?
我jtidy configuratio如下:
Tidy tidy = new Tidy();
tidy.setTidyMark(false);
tidy.setXHTML(true);
tidy.setXmlOut(false);
tidy.setNumEntities(true);
tidy.setSpaces(2);
tidy.setWraplen(2000);
tidy.setUpperCaseTags(false);
tidy.setUpperCaseAttrs(false);
tidy.setQuiet(false);
tidy.setMakeClean(true);
tidy.setShowWarnings(true);
tidy.setBreakBeforeBR(true);
tidy.setHideComments(true);