2013-07-19 73 views
0

我正在開發混合SQL(含mySQL)和HDF5數據庫解決方案進行數據分析。我的一些數據非常適合於關係數據庫,SQL作爲查詢語言非常方便和有效,但是我擁有大量的數值數據(數組和數組或矩陣與數千或元素/行/列)。因此,我將它們保存在HDF5文件中,並根據每個觀察值之間的一些共同點排列組層次結構,以便如果將用於派生該層次結構的字段添加到SQL Select查詢中,並添加索引關係數據庫與特定觀察數據集中的位置關聯起來,我可以快速找到HDF5文件中的數字數據。查詢SQL + HDF5混合體

我正在Python,Numpy和H5py中編寫所有這些。但是,在某些時候,我想讓整個事情更加用戶友好,甚至可以在網絡服務器上進行查詢和可視化。我最初的猜測是從像Django或SQLAlchemy這樣的ORM開始,然後添加一些我的實際腳本來處理HDf5。有沒有人有這種類型的混合方法的經驗,尤其是在這個級別?任何提示新手?

回答

1

你可能有興趣在此工作: Supporting a Light-Weight Data Management Layer over HDF5

BTW,更多功能,包含索引,採樣和結構分組已這項工作後開發的。

+0

我知道這篇論文。但是這個軟件可用嗎? – weatherfrog

+0

它尚未開源,但如果需要,我可以向您發送源代碼。 – SciPioneer

+0

可悲的是,我的名聲不允許票(尚),但非常感謝你的文章,這是非常有趣的! –