我要存儲在一個壓縮格式下列元組的列表,我想知道哪種算法給我最好的壓縮算法? (見下文的最好的定義)
- 最小壓縮大小
- 最快德/壓縮
- 最佳折衷(權衡曲線的 「拐點」)
我的數據是這樣的:
(<int>, <int>, <double>),
(<int>, <int>, <double>),
...
(<int>, <int>, <double>)
這兩個整數中的一個指的是一個時間點,並且很可能最終在一個列表中的數字彼此接近。另一個int代表一個抽象的id,並且值不太可能接近,儘管它們也不會完全隨機。雙重代表傳感器讀數,雖然這些值之間存在某種相關性,但它可能沒有多大用處。
感謝您指出這一點,我使用pb序列化了一些東西,所以在我的上下文中它是一個很自然的選擇。你知道他們是否用較短的序列壓縮重複模式?如果不是,我也可以使用RTF規範。 ;-) – 2008-11-10 10:42:33