我想壓縮很多小字符串(大約75-100長度的c#字符串)。 當字典被創建時,我已經知道所有的短字符串(接近1萬億)。未來不會有額外的短串。 我需要額外的一個字符串,而不需要解壓縮其他字符串。壓縮小字符串,用什麼來創建外部字典?
現在我正在尋找一個圖書館或做以下的最佳方式:
- 創建字典使用我
- 所有字符串使用該字典
- 的方式壓縮每串使用從1的字典壓縮一個字符串。
我發現一個good related question,但這不是c#特定的。也許有些東西是我不知道的c#,或者一個花哨的圖書館或者某個人已經完成了。這就是我問這個問題的原因。
編輯:
隨着字典,我在談論這樣的事情:http://en.wikipedia.org/wiki/Dictionary_coder 但是,一切都有助於獲得字符串短。字符串是各種語言和URL(30%/ 70%)的簡短文本消息。壓縮的字符串不需要人類可讀。它將被存儲在二進制文件中。
字符串中的數據類型是什麼? (主要是ASCII?隨機字母?GUID?) – Cameron
通過詞典,你的意思是存儲鍵值對的.NET Dictionary類嗎?這些字符串是否會用作字典中的鍵或值?如果字符串只是值,那麼鍵是什麼? –
主要是ascii,而不是隨機的。像簡短的短信,句子和網址。 – Chris