2016-03-04 169 views
-4

有人知道壓縮html代碼的最佳算法嗎? 我不在乎速度,字典大小和其他類似的東西,但只是最終壓縮算法Html壓縮

我知道gzip,但我想要更好的東西。

+0

你壓縮傳遞給你有充分的事:有可能的解壓縮算法對bzip2的和LZMA,你應該檢查出的JavaScript端口,但要知道,這些不是由本地瀏覽器支持在另一端的控制?例如不是一個網頁瀏覽器,它只限於它所知道的格式。 – scunliffe

+0

@scunliffe不是網絡瀏覽器,我可以完全控制另一端,所以我可以選擇任何算法 – Neir0

+0

我的猜測是,如果您的html源代碼_only_包含標準標籤和屬性,您可以使用類似的東西擊敗通用算法霍夫曼用已知的常見HTML短語的固定字典,但如果你的html甚至有適量的自定義文本,你將很難擊敗bzip2和朋友。用自定義字典的一個問題是,您遇到的_everything_必須存在,否則您需要使用擒縱邏輯,這會導致您的壓縮流增長。 –

回答

1

你應該看看bzip2和lzma。兩者都可以具有比gzip更好的壓縮比,並且速度也更快。

您是否將此HTML代碼提供給客戶端瀏覽器?

​​

+0

問題是我知道一些關於我要壓縮的數據。因此,我可以使用這些信息獲得比「常用」算法(如zip rar等)更好的結果。例如,我可以在我的文檔中創建最常用術語的字典,並將其用於壓縮。對於確定的div,a和其他標籤將位於頂部。所以我認爲可以實現更好的結果 – Neir0

+0

zlib允許使用預設字典。這聽起來更像你正在尋找的東西。 –