我正在創建一個python模塊,用於創建和操作數據結構,以存儲大量來自真實實驗的語義標記數據和元數據。因此,在一個實驗中,你有:樹的樹?樹木表?我創建了什麼樣的數據結構?
- 科目
- 治療
- 複製
圍護這3類是實驗,三個類別的組合是什麼,我叫「單位」 。現在有3(臺狀)之間沒有本質上正確的層次結構,但對於某些分析它是認爲3作爲層次結構的特定排列的有用,
例如(受試者 - >(處理 - >(重複)))
或
(複製 - >(處理 - >(受試者)))
此外,收集數據時,文件將被複制粘貼到桌面上的文件夾中,因此數據至少會以樹的形式出現。我已經考慮了很多關於哪個層次更好的問題,但我一直在爲6種可能的排列中的大多數提供用例。我希望我的模塊具有靈活性,因爲用戶可以考慮實驗或使用任何層次結構,表格,層次結構表格混合對他們有意義來收集數據。
另外,「單元」或(表條目)中的任何組織的複雜性爲數據的任意數量的容器(字節到千兆字節,不管理想情況下)。這就是爲什麼我不認爲關係數據庫方法真的要走,而NoSQL類型的解決方案更有意義。但是,如果沒有一個「正確」,我就會遇到如何訂購這三個類別的問題。
所以我的問題是這個多層面的數據結構是什麼?
是否存在某種流體數據結構或一組算法來輕鬆地進行相互轉換或生成結構化視圖?
你應該選擇任何方式來存儲信息,並有一個接口轉換爲其他類型的結構。如果只有兩種數據表示,那麼它不應該太難。 – PepperoniPizza
這就是我已經在做的事情。我問是否有API可以用來簡化這個。 – salotz