我正在檢查斯坦福CoreNLP以瞭解NER和POS標記。但是,如果我想爲像<title>Nights</title>, <genre>Jazz</genre>, <year>1992</year>
這樣的實體創建自定義代碼,該怎麼辦? CoreNLP在這種情況下有用嗎?自定義NER和POS標記
4
A
回答
4
CoreNLP開箱即用會限制他們提到的類型:人員,位置,組織,雜項,日期,時間,金錢,數量。不,你不能只是假設它可以「憑直覺」做:)
在實踐中認識到其他實體,你必須選擇,要麼:
- 另找NER系統標記這些類型
- 使用基於知識/無監督的方法解決此標記任務。
- 搜索包含你想認識的類型,並重新訓練監督NER系統(CoreNLP或其他)
- 生成(以及可能的註釋)自己的資源額外的資源(語料庫) - 那麼你就必須定義一個註釋方案,規則等 - 非常有趣的工作部分!
事實上,除非您找到滿足您需求的現有系統,否則需要付出一定的努力!無監督的方法可以幫助您引導系統,以查看您是否需要查找/註釋專用語料庫。在後一種情況下,最好將數據作爲train/dev/test部分分開,以便能夠評估由此產生的系統對不可見數據執行的操作數。
1
看看這個FAQ(http://nlp.stanford.edu/software/crf-faq.shtml)使用CRF分類器來訓練你的模型的新類。你可能會覺得它很有用。
相關問題
- 1. 運行Stanford NER和Stanford POS標記器時出現IncompatibleClassChangeError
- 2. 如何讓NER和POS使用斯坦福CoreNLP標記預標記文本?
- 3. Three.CurvePath和自定義標記
- 4. 自定義詞性標記與回退到nltk內部pos
- 5. 自定義標記
- 6. 自定義NER模型 - 失敗
- 7. NER承認自定義實體
- 8. nltk pos標記expletives
- 9. 自定義地圖標記和自定義背景
- 10. 使用gmap3自定義InfoWindow和標記
- 11. 自定義JSP標記和Tomcat 8
- 12. 自定義Django標記和jQuery
- 13. VichGeographicalBundle和Symfony2中的自定義標記
- 14. 使用POS標記來否定句子
- 15. 自定義選擇標記
- 16. Struts2:自定義s:textfield標記
- 17. 自定義降價標記
- 18. Openlayers自定義標記
- 19. Jsf 2.0自定義標記
- 20. Mapbox自定義標記
- 21. 自定義地圖標記
- 22. 自定義標記覆蓋
- 23. 自定義標記上傳
- 24. 使用自定義標記
- 25. matplotlib自定義標記
- 26. 自定義標記與nltk
- 27. ASP.NET:自定義子標記
- 28. 自定義標記與Php
- 29. 在pyspark中編寫自定義的NER和POS標記器以用於流水線方法以用於文本輸入的特徵提取
- 30. nltk自定義標記器和標記器
是的,CoreNLP可以使用自定義「標籤」。 「年份」應該已標記爲DATE。一個簡單的方法是使用公報功能。您需要仔細閱讀文檔,多次。 –