我需要壓縮格式文本壓縮 - 什麼算法使用
[70,165,531,0|70,166,562|"hi",167,578|70,171,593|71,179,593|73,188,609|"a",1,3|
的數據包含幾千個字符(10000 - 50000約)的一些文本數據。
我讀了各種壓縮算法,但不能決定在這裏使用哪一個。
重要位置的事情是:壓縮串應該只包含alphanumberic字符(或幾個特殊字符,如+ -/&%@ $ ......)我的意思是最算法提供了亂碼的ASCII字符作爲壓縮數據嗎?這必須避免。
有人可以指導我如何在這裏繼續?
P.S本文主要包含numbers
,'
和|
字符。其他角色發生的非常非常罕見。
「大多數算法提供亂碼ascii字符」 - 不,它們提供_bytes_。字節和字符是不同的東西。 – 2012-07-23 07:04:44