我有類似的文字:「這項研究是作爲工作,家庭和健康網絡(www.WorkFamilyHealthNetwork.org)的一部分進行的,該網絡由合作協議通過美國國立衛生研究院和疾病中心控制和預防:Eunice Kennedy Shriver國家兒童健康與人類發展研究所(Grant#U01HD051217,U01HD051218,U01HD051256,U01HD051276),國家老齡研究所(Grant#U01AG027669),行爲科學研究辦公室和國家職業研究所安全與健康(批准號U01OH008788,U01HD059773)「。我需要將捐助者與捐款號碼連接起來,例如:美國國立衛生研究院和疾病預防控制中心:Eunice Kennedy Shriver國家兒童健康與人類發展研究所 - U01HD051217,U01HD051218,U01HD051256,U01HD051276國立老齡化研究所 - U01AG027669。我認爲這是一個共同解決問題,並試圖訓練我自己的模型。任何想法我怎麼能做到這一點?我試圖按照這裏的指示(https://stanfordnlp.github.io/CoreNLP/coref.html#training-new-models),但由於他們使用C0NLL數據集,我沒有看到我可以如何將自己的數據轉換爲它們的格式。有人幫忙嗎?如何使用Stanford NLP(或其他軟件包)來培訓我自己的coref(共同參與決議)模型?
0
A
回答
-1
java -cp "*" -Xmx4g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner -file input.txt -outputFormat conll
上面會給你conll格式數據
然後你就可以得到XML進行COREF並與conll合併以獲得完整的數據
相關問題
- 1. Stanford Ner:建立我自己的模型或使用RegexNer?
- 2. 如何通過培訓創建斯坦福核心NLP模型?
- 3. 培訓斯坦福CoreNLP共同參考
- 4. NLP模型訓練
- 5. Stanford Core NLP LexicalizedParser模型
- 6. 斯坦福NLP培訓documentpreprocessor
- 7. 當tmp/roth_sentences.ser在培訓Stanford Relation Extractor模型時發生FileNotFoundException
- 8. 如何使用我自己的POS數據來訓練syntaxnet模型?
- 9. 別名或自定義基於核心或規則的Coref在斯坦福NLP
- 10. 重新培訓對象檢測模型與自己的圖像(tensorflow)
- 11. Stanford核心NLP英語語言模型
- 12. 增量語言模型培訓與lingpipe
- 13. 打開NLP名稱查找器培訓
- 14. 最佳實踐,以「運輸」培訓了來自sklearn模型
- 15. 如何使用已經在SKLearn培訓的模型?
- 16. 如何使friendly_id gem使用來自其他模型的屬性?
- 17. Tokenizer培訓與StanfordNLP
- 18. 在opennlp中訓練自己的模型
- 19. 如何使用我自己的訓練模型和在tensorflow中實現的facenet?
- 20. 如何在與其他軟件包具有相同名稱的作曲家中使用軟件包?
- 21. 再培訓以來
- 22. stanford nlp tokenizer
- 23. Stanford NLP安裝
- 24. Stanford NLP - NER&Models
- 25. 如何比較決議與其他一些決議
- 26. 如何針對自定義NameFinder模型進行OpenNLP培訓?
- 27. CNTK - 模型的不完整培訓
- 28. 斯坦福核心NLP情感分析:用我自己的數據進行培訓
- 29. 圖書館培訓來自MFCC的GMM
- 30. 擴展OpenNLP組織模型的培訓