什麼是生物信息學參與者應該知道的一些數據結構?我想任何人都應該知道列表,哈希,平衡樹等,但我期望有特定於域的數據結構。有沒有專門討論這個問題的書?生物信息學的數據結構
回答
生物信息學中使用的最基本的數據結構是字符串。還有一系列代表字符串的不同數據結構。而字符串匹配等算法則基於高效的表示/數據結構。
這一綜合性工作是丹Gusfield的Algorithms on Strings, Trees and Sequences
一個生物信息學很多入門書籍將介紹一些你會使用的基本結構。我不確定標準課本是什麼,但我相信你可以找到。這可能是看一些具體的語言書籍有用:我選擇了這兩個作爲例子,因爲它們是由O'Reilly出版,
其中,以我的經驗,出版高質量的書籍。
我只是碰巧在我的硬盤上安裝了Python書籍,其中大部分內容都是關於使用Python處理生物信息學字符串的。它似乎不像生物信息學使用任何奇特的特殊數據結構,只是現有的。
生物信息學中的許多項目涉及結合來自不同的半結構化來源的信息。 RDF和本體在很多方面都是必不可少的。例如,參見bio2RDF項目。 http://bio2rdf.org/。對標識符的理解很有價值。
許多生物信息學是探索性的,而且經常使用快速輕量級的工具。請參閱工作流程工具,例如Taverna,其中主要資源通常是一組Web服務 - 因此HTTP/REST很常見。
例如空間散列數據結構(kd-tree)通常用於任意特徵向量的最近鄰查詢以及3d蛋白質結構分析。
您$$的最佳書籍是Understanding Bioinformatics by Zvelebil,因爲它涵蓋了從序列分析到結構比較的所有內容。
除了基本熟悉你所提到的結構,suffix trees(和後綴數組),de Bruijn graphs,和interval graphs被廣泛使用。 The Handbook of Computational Molecular Biology寫得很好。我從來沒有讀過所有的東西,但我用它作爲參考。
我也強烈推薦這本書,http://www.comp.nus.edu.sg/~ksung/algo_in_bioinfo/
而最近,Python是更頻繁地在生物信息學比Perl使用。所以我真的建議你從python開始,它在我的項目中被廣泛使用。
無論您的數學或計算專業知識是什麼,您都可能在計算生物學中找到應用。如果沒有,請將這個另一個stackoverflow的問題,你會得到幫助:o)
正如在其他答案中提到的,在一維數據的字符串比較和模式發現有些永恆,因爲序列是如此容易得到。隨着對醫學信息學的重新興趣,您還可以進行二維/三維圖像分析,例如運行鍼對基因組數據。通過分子生物化學,您還可以在3D表面和分子模擬上進行模式搜索。爲了研究藥物效應,您將使用基因網絡並比較各種組織。大數據和信息集成的典型挑戰適用。然後,您需要對偶然發現的任何特徵的模式或臨牀關聯可能性的統計描述。
- 1. 具有負面結果的生物信息學數據庫?
- 2. 生物信息學資源
- 3. Linux生物信息學工具
- 4. 如何使用結構來保存關於學生的信息?
- 5. c的股票信息數據結構?
- 6. 檢索數據結構對齊信息
- 7. 需要SQL數據結構信息
- 8. 衍生物數學
- 9. 生物信息學的最佳操作系統?
- 10. 生物信息學 - 氨基酸的常見基序
- 11. 學生的表結構
- 12. 結構化信息
- 13. 生物信息學 - 需要得到ATOMS序列
- 14. 我需要幫助完成這個生物信息學程序
- 15. 生物信息學開源工具貢獻
- 16. 分配數據結構並將信息傳遞到數據結構中
- 17. 學生考勤表結構
- 18. 學習數據結構的來源
- 19. 從linux中的生物結構散列數據
- 20. 在Linux中訪問生物結構中的緩衝區數據
- 21. 購物車的數據庫結構
- 22. WCF結構肥皂信息
- 23. 將信息讀入結構數組C++
- 24. 將結構信息輸入到數組
- 25. 返回學生信息 - SQL/C#分配
- 26. 學生信息文件處理
- 27. 創建學生信息系統
- 28. 學生信息系統編譯錯誤
- 29. 保存數據結構的類型信息
- 30. 什麼是存儲位置信息的最佳數據結構?
同意。古斯菲爾德的書很全面。 – awesomo 2010-11-30 07:59:06