2013-10-30 37 views
0

有一天我測試了我的PHP Tidy配置,發現它無法處理來自the guardian的任何頁面。PHP Tidy清除關閉</head>標記不正確

我的配置是:

$tidy_config = array(
    'new-blocklevel-tags' => 'article aside audio figure footer header nav section source track video svg', 
    'new-empty-tags' => 'source track', 
    'new-inline-tags' => 'audio canvas embed video', 
    'wrap' => 0, 
    'markup' => false, 
); 

$tidy->body()輸出一個空的本體,而我注意到$tidy->html()輸出不包含原始</head>(在源它存在),而是它移動到端(彷彿它由Tidy本身添加)。

我已經測試了衛報頭版和一些新聞/專欄頁面,相同的問題。此配置適用於英國廣播公司或其他網站在我的測試,至少我不希望它返回空body或移動關閉head標記。

任何人都可以找出原因嗎?

PS:我的Tidy發佈版本是25 March 2009,據我所知是最新版本

回答

0

Sourceforge的整理票務系統中有一項功能請求,要求支持HTML5。衛報頁面使用HTML5。

另一方面,我會說Tidy沒有被積極開發了。所有提交到CVS存儲庫的提交都已經過去了幾年,最近的一次提交是在21個月前的實驗目錄中改變了有關HTML5的一些內容。 Github還有一個分支,一年前最後一次提交。 https://github.com/w3c/tidy-html5你可以嘗試編譯這個。

+0

雖然我知道w3c fork,但我不認爲這個問題是「整潔不支持HTML5」,head標籤不是HTML5,doctype應該是向後兼容的。此外,w3c分支在一年內報警並沒有更新(在問題上也沒有回覆) – bitinn