2012-05-16 74 views
0

我正在開發基於本體的醫學文本註釋工具,我在查找適當的數據集時遇到了一些麻煩。註釋工具的醫療數據集

我正在使用疾病本體,所以我需要一個專注於疾病及其症狀/治療的醫療數據集。

數據集應該最好是自然語言文章(文章,研究等),但是基於字典和基於列表的文本也可能有幫助。

謝謝你的幫助!

回答

0

你的意思是說你正在尋找一個生物醫學文本語料庫進行註釋?即。確定關鍵術語。你可以嘗試一下pubmed摘要 - 他們在Linked Open Data cloud,你可以試用維基百科的消費級別的東西,甚至NIH網站的開放獲取期刊目錄都會有很多公開的學術資料來註釋。

如果您還沒有 - 請查看UMLS(及其旁邊的項目,如metamap) - 它對於任何種類的生物醫學NLP都是無價的。如果你有興趣,我想我有一份UMLS和疾病本體之間的映射文件的副本。 (RDF UMLS,http://linkedlifedata.com