2016-04-22 96 views
0

我的實驗室正在進行大量的測序工作,但序列記錄的方式使得很難檢索它們或記錄數據。我想創建一個具有以下功能的數據庫: -A允許用戶上傳/檢索/查看數據的圖形用戶界面,並且可以包含鏈接以快速對其他在線工具進行BLAST或序列分析。
- 允許一個訪問它 - 即對有一個什麼樣的實驗室記錄的GUI另一部分命令行 ,需要訂購等創建生物數據庫:第一步?

我想知道,如果有一般的數據庫是什麼我可以採用和修改模板以滿足我的實驗室需求?我沒有數據庫設計經驗,但已閱讀關於mySQL。

我在開始這個項目時應該採取的第一步是什麼?

謝謝!

回答

1

這是一個有趣的問題和問題域(我現在有btw的expierence)。您的第一步是決定一個通用體系結構,然後爲此選擇技術。

對於網絡/圖形方面,有很多現成組件(我假設您知道AntiSMASH,JBrowse等工具)。但你需要評估這些。這是超出了數據庫方面的範圍。

在數據庫方面,PostgreSQL在這裏表現令人讚歎。我曾在一個重負載的10 + TB數據庫上工作,這個數據庫專門存儲了測序數據,BLAST報告等等。如果你在上面添加PostBIS之類的東西,你會得到一些相當實用的東西。

然而,業界中很多較重的部分都在使用Hadoop,因爲可用數據量增長非常迅速,但實現該工作所需的專業知識數量也相應較高。