我有一個HTML文件,其中可能包含Javascript,PHP以及所有這些人可能會或可能不會放入其HTML文件的內容。在HTML中查找註釋
我想從此html文件中提取所有評論。
我可以指出兩個問題在做這個:
什麼是一個語言的評論可能不會出現在其他評論。
在Javascript中,其餘行使用
//
標記進行了註釋。但是其中的URL也包含//
,因此我可以很好地刪除部分網址,如果我只用//
替換//
,然後再用 替換該行的其餘部分即可。
所以這不是一個小問題。
是否有任何解決方案可以滿足這些需求?
有沒有人已經這樣做?
你是對的,這不是微不足道的。爲了可靠地刪除註釋,您需要完全解析文件(PHP,HTML和Javascript)。如果可能,我建議使用PHP;雖然我更喜歡Perl,但PHP的工具本身比Perl工具更好地處理PHP。這裏是讓你開始的東西:http://stackoverflow.com/questions/503871/best-way-to-automatically-remove-comments-from-php-code。然後,您只需在PHP中查找HTML和JavaScript解析器就可以對文件的這些部分進行同樣的操作。 – dan1111
爲什麼你會在你的HTML文件中使用PHP?我只有CSS,JavaScript和HTML,然後是谷歌的「HTML Minifier」,可以刪除評論,空白和一般「瘦」你的網頁的產品。 –
@RB。預渲染? – Jivings