Q
疾病命名實體識別
6
A
回答
2
見http://www.ebi.ac.uk/webservices/whatizit/info.jsf
高級繪畫紙是一種文字處理系統,讓你做文本挖掘文本 任務。這些任務由管道在上面窗口的下拉列表中刪除 定義,文本可以粘貼在文本 區域中。
你也可以問biostars:http://www.biostars.org/show/questions/
2
有很多工具來做到這一點。一些流行的:
- NLTK(蟒蛇)
- LingPipe(JAVA)
- Stanford NER(JAVA)
- OpenCalais(網絡服務)
- Illinois NER(JAVA)
最他們有一些預定義的模型,即他們已經接受了一些常規數據集的訓練(新聞文章等)。但是,您的文本非常具體,因此您可能需要首先構建語料庫並重新訓練其中一種工具,以便根據數據進行調整。
更簡單地說,作爲第一個測試,您可以嘗試一種基於字典的方法:設計一個實體名稱列表,並執行一些精確或近似匹配。例如,該操作在LingPipe's tutorial中描述。
6
這裏有兩條管道是專門爲醫療文檔解析設計:
都使用UMLS,統一醫療語言系統,因此需要你有一個(免費)許可證。兩者都是Java,並且或多或少都易於設置。
+2
我不確定我會將它們歸類爲「易於設置」,但它們工作得相當好。MetaMap的新版本也於去年年底發佈。 –
相關問題
- 1. 命名實體識別
- 2. 命名實體識別和命名實體提取有什麼區別?
- 3. 用於命名實體識別的NLTK
- 4. 使用WEKA命名實體識別
- 5. 爲Java命名實體識別庫
- 6. 聚焦命名實體識別(NER)?
- 7. 意大利的命名實體識別
- 8. StanfordNLP:ArrayIndexOutOfBoundsException用於命名實體識別
- 9. c#命名實體識別器工具
- 10. 在Python中爲NLTK命名實體識別。識別NE
- 11. 斯坦福命名實體識別器中的多項命名實體
- 12. 命名實體識別:對於新/最新實體
- 13. 命名實體識別中實體的分割
- 14. 命名實體識別和解析之間的區別?
- 15. 命名實體識別與Python/PHP的預設名稱列表
- 16. 我可以使用命名實體識別來識別Intranet頁面內容嗎?
- 17. 計算實體在NLP中的置信度得分命名實體識別
- 18. 命名實體識別在門使用LingPipe
- 19. 政治領域中的命名實體識別
- 20. 是否有命名實體識別的任何C#庫?
- 21. 使用apache stanbol進行命名實體識別
- 22. 如何在OpenNLP中讀取命名實體識別的文檔
- 23. 對大寫文本進行命名實體識別
- 24. 使用條件隨機場進行命名實體識別
- 25. 使用Python從個人Gazetter中命名實體識別
- 26. 命名實體識別數據和功能
- 27. NLTK用自定義數據命名實體識別
- 28. 無限while循環中的Java命名實體識別
- 29. 使用nltk將日期識別爲命名實體?
- 30. 免費標記語料庫進行命名實體識別
這聽起來很具體,而不是一個編程問題*本身*。至少不是這裏所表達的。 –
似乎這是更多的數據挖掘問題? – Harpal