2012-02-28 46 views
2

我正在使用JTidy(HTML Tidy庫的Java端口)來清理一些現有的網站。當我使用我的JTidy配置似乎是非常嚴格的,並最終切斷頁面的底部(壞標記)。W3C HTML Validator使用JTidy(HTML-Tidy)配置

當我通過w3c HTML驗證器工具運行相同的標記時,它會清理它,但在重寫時更加智能;而不是剔除標籤,它似乎智能地猜測缺失標籤的位置,並相應地更新結構。

有誰知道HTML-Tidy配置w3c使用?

我jtidy configuratio如下:

Tidy tidy = new Tidy(); 
    tidy.setTidyMark(false); 
    tidy.setXHTML(true); 
    tidy.setXmlOut(false); 
    tidy.setNumEntities(true);   
    tidy.setSpaces(2); 
    tidy.setWraplen(2000); 
    tidy.setUpperCaseTags(false); 
    tidy.setUpperCaseAttrs(false); 
    tidy.setQuiet(false); 
    tidy.setMakeClean(true); 
    tidy.setShowWarnings(true); 
    tidy.setBreakBeforeBR(true); 
    tidy.setHideComments(true); 

回答

1
由W3C驗證使用

整齊配置是可用的here