2
A
回答
2
我對此表示懷疑。
理論上講,如果你有大量的帶註釋的語料庫,你可以使用純監督學習技術。但是,如果您不能使用語言相關規則,啓發式或特徵,並且您正在尋找高精度和召回率 - 語料庫的大小必須非常龐大。我敢說,對於這樣的任務,可能沒有足夠的註釋數據用於任何給定的人類口語。
相關問題
- 1. c#命名實體識別器工具
- 2. 命名實體識別
- 3. 語言學習語音識別工具
- 4. 用於命名實體識別的NLTK
- 5. 意大利的命名實體識別
- 6. 命名實體識別和命名實體提取有什麼區別?
- 7. 使用WEKA命名實體識別
- 8. 爲Java命名實體識別庫
- 9. 聚焦命名實體識別(NER)?
- 10. 疾病命名實體識別
- 11. StanfordNLP:ArrayIndexOutOfBoundsException用於命名實體識別
- 12. 多語言命名實體鏈接
- 13. 免費標記語料庫進行命名實體識別
- 14. 語言識別
- 15. 在Python中爲NLTK命名實體識別。識別NE
- 16. 命名實體識別中實體的分割
- 17. 無限while循環中的Java命名實體識別
- 18. 斯坦福命名實體識別器中的多項命名實體
- 19. 如何在OpenNLP命名實體識別工具中添加POS標記功能
- 20. Bluemix語言識別不識別英語
- 21. 命名實體識別:對於新/最新實體
- 22. 使用NLTK命名實體識別。提取的關鍵字的相關性
- 23. 命名實體識別和解析之間的區別?
- 24. 識別此語言
- 25. 的Android無法識別不同的語言字體
- 26. 命名實體識別與Python/PHP的預設名稱列表
- 27. 如何通過OpenNLP爲阿爾巴尼亞語實現命名實體識別?
- 28. 堆棧語言的識別
- 29. Rsync無法識別語言環境
- 30. Shell無法識別別名命令
當然不存在支持所有世界語言的現成工具。你在尋找一些你可以在自己的數據上訓練的東西,或者是一個處理一堆語言的工具嗎?如果後者使用哪種語言? –
我喜歡爲我自己的語言馬其頓語開發一個工具。我知道不可能有一個圖書館是獨立的,但也許有一些對我來說沒有什麼幫助:) – vikifor
你可以選擇任何一個很好的圖書館,然後重新訓練馬其頓標記的數據。這在斯坦福大學的CRF-NER中很常見,儘管結果遠非完美,但它通常足以作爲基準線。 –