1
我有機會爲放氣壓縮預置字典。這對我來說是有道理的,因爲要壓縮的數據是相對較小的1kb-3kb,並且我有大量代表性示例。要壓縮的數據由任意的字節序列組成,所以標記等不是一個好的方法。此外,數據顯示了很多重複(數據示例之間),所以好的字典可能會給出非常好的結果。 問題是如何計算好字典?是否有算法計算最佳字典(給出樣本數據)?如何計算良好的預設字典用於放氣壓縮
我開始查看前綴樹,但不清楚如何在此上下文中使用它們。
最好的問候, 亞雷克
謝謝馬克,這正是我現在正在做的。即使使用簡單的連接示例,壓縮也相當不錯。我還會嘗試找到最常見的子字符串並將其放在字典末尾。我也計劃使用多個字典(我的樣本可以自然地分成子類)。 –