除CouchDB和原生XML數據庫(如eXist)之外,哪些數據庫可以存儲和查詢未結構化和半結構化數據?我已經交了許多不同格式的數據(XML,JSON,YAML,CSV,一些自定義格式),我需要合併和處理,但在關係數據庫中開發模式將是時間 - 消耗和困難。可以處理半結構化數據的數據庫?
主要是,我正在尋找開源解決方案。另外,在某些時候,我想讓這些數據可用。
我知道將所有這些數據轉換爲通用格式來處理會有一些開銷。 XML前端有一些很好的選擇:eXist-db和BerkeleyDB-XML似乎有很好的XQuery支持。另外,雖然還很年輕,但CouchDB看起來很有希望,它具有簡單的「文檔」格式。
我看過的其他途徑是OODBMS,如ZODB和db4o;編寫一些簡單的解析腳本,然後將結果記錄對象「按原樣」存儲。之後的問題在於查詢它們; OODBMS似乎沒有很好的查詢引擎歷史。
我不喜歡的是「blobs-in-relational-db」解決方案。看起來像一個黑客,並沒有真正考慮到數據的演變,FT索引等。
有沒有其他解決方案我沒有遇到過?
數據是半結構化的,但結構通常不匹配任何其他文檔/文件。 – 2008-10-22 22:44:02