我在尋求如何更好地幫助壓縮工具獲得更好的無損壓縮的建議。幫助大型自定義數據文件壓縮的方法
我有許多包含來自各種傳感器的傳感器讀數的大文件(> 100meg)。來自各種傳感器的樣本具有不同的比特尺寸(16比特,24比特,32比特)和不同的頻率(70Hz至250Hz)。使用我知道的通用壓縮器(zip,gzip,bzip2),我可以獲得大約70%原始文件大小的壓縮文件。在我看來,如果我可以告訴壓縮工具這些字節是這種類型的樣本,那些字節是另一種樣本類型可能會有壓縮增益,但我沒有意識到任何事情會讓我這樣做。
算法的zip家族是通用的,最適合用於檢測輸入中字節序列何時重複。在您的情況下,利用您對數據的先前知識的自定義壓縮算法可能會大幅超越此類通用算法。 – 2013-02-08 21:21:41