我正在尋找一種方式在nokogiri去除HTML空白&評論和JavaScript評論(/ * * /,/ /)。我這樣做並不是因爲文檔的大小。我正在玩機架中間件來完成這項工作。我知道我可以通過正則表達來做,但我認爲這可能會很麻煩。如何使用nokogiri去除HTML空白和評論和javascript評論?
如果不可能與nokogiri做,請給我最好的正則表達式去掉以上兩種情況。
我使用正則表達式的嘗試:
response = @app.call(env)
body = response.last.body.gsub(/(\n|\t|\r)/, ' ').gsub(/>\s*</, '><').gsub(/<!--[^>]*-->/, ' ').squeeze(' ')
response.last.body = body
response
我認爲應該做的,而不是使用正則表達式更清潔的方式。
這個問題並沒有顯示你已經嘗試了什麼,或者你遇到了什麼特定的問題。請參閱http://stackoverflow.com/faq#dontask,特別是「基於您面臨的實際問題」。 –
好吧,我更新了問題,說明我已經嘗試過。 – Chamnap