4

我想使用面向文檔的數據庫存儲大量JSON文檔,所有這些數據庫都具有非常相似的模式(儘管不完全相同)。是否有任何主要的面向文檔的數據庫系統在其JSON文檔中壓縮密鑰?

一個實例文件:

{ 
    "firstName": "John", 
    "lastName": "Smith", 
    "age": 25, 
} 

執行任何系統(CouchDB的等)的使用壓縮(任何種類的),以避免一遍一遍存儲密鑰串(例如「名字」)?

我的動機是當數以百萬計的文檔時,儘量減少磁盤上數據庫的大小,特別是當某些重複密鑰遠遠長於例如。 「名字」。

感謝您的想法!

W¯¯


編輯:(?部分)已經想過這個多了,什麼我想我問的是,其中壓縮字典是一個更一般的壓縮系統的特定情況下共享跨越文檔存儲中的多個壓縮文檔(並且可能隨着時間而建立)。然後這將處理不僅僅是JSON密鑰的壓縮。

會很有趣!

+0

我沒有意識到此時支持壓縮的任何文檔存儲(並不意味着沒有)。有一個在Mongo上開放的JIRA支持:http://jira.mongodb.org/browse/SERVER-164?page=com.atlassian.jira.plugin.system.issuetabpanels:all-tabpanel – 2011-02-16 00:00:20

+0

Mongo Jira在說話關於gzip一般 - 不完全相同,但可能是如果壓縮字典將被構建並用於具有商店的多個文檔。 – wodow 2011-02-16 11:14:51

回答

2

我只想補充,你存儲密鑰和他們的快捷方式「鍵映射」文件......在做後端的映射不應該那麼多麻煩......

{ 
    FirstName: 'a', 
    Town: 'b' 
} 

{ 
    a: 'Peter', 
    b: 'Zurich' 
} 
相關問題