是否有任何現有的帶標記實體的數據集來訓練MITIE模型? 我檢查了鏈接,https://github.com/mit-nlp/MITIE/blob/master/examples/python/train_ner.py只用兩個樣本訓練模型。是否有任何現有的帶標記實體的數據集要訓練?數據集訓練MITIE模型
1
A
回答
2
我一直在尋找這樣的東西。只是爲了「通用」(因此不是非常有用的)NLU後端。到目前爲止,我發現的唯一一件事是一個訓練有素的模型,包含9個新聞類別(不是非常通用的)。請參閱此處的博客文章:http://eric-yuan.me/ner_1/
如果您可以選擇切換NER,那麼spaCy默認情況下會提供訓練有素的模型。它的可視化前端可以通過谷歌「displacy」找到
如果您發現任何其他問題,請告訴我!
編輯:花了一天看着這個,我想我已經找到了你在追求什麼。如果你去https://github.com/mit-nlp/MITIE/releases那裏,你會發現MITIE自己的NER模型在維基百科,Freebase等訓練。實際的訓練數據集也在那裏。他們的github頁面上的README提供了關於如何使用預先訓練的模型的示例。您還可以調查examples文件夾中的ner.py文件,以瞭解如何在Python代碼中使用預先訓練好的模型。
相關問題
- 1. 加速使用MITIE和Rasa的模型訓練
- 2. 訓練數據集
- 3. 使用OpenNLP訓練大型數據集
- 4. FANN訓練數據集
- 5. NLP模型訓練
- 6. 不平衡訓練數據集和迴歸模型
- 7. TensorFlow:自定義圖像數據集上的訓練模型
- 8. 分割訓練數據以訓練n個模型的最佳數量
- 9. 重新訓練tensorflow模型
- 10. 如何訓練ML模型?
- 11. 錯誤訓練im2txt模型
- 12. LightGBM:繼續訓練模型
- 13. 訓練分類模型Opennlp
- 14. Keras訓練稀疏模型
- 15. 訓練數據集羣的BOW預測
- 16. SegNet - 訓練我自己的數據集
- 17. R glm()不包括訓練數據集
- 18. 基於訓練集的數據分類
- 19. R中的auto.arima的訓練數據集
- 20. 地面真相與訓練數據集
- 21. PyBrain:MemoryError:加載訓練數據集
- 22. 在大塊數據集上訓練SGDRegressor
- 23. Tesseract訓練數據
- 24. 如何在Apache Spark中訓練Matrix分解模型MLlib的ALS使用訓練,測試和驗證數據集
- 25. 加載訓練有素的Keras模型並繼續訓練
- 26. TensorFlow:收集我自己的訓練數據集&使用該訓練數據集來查找對象的位置
- 27. 1)從整個訓練集中訓練CNN和2)訓練集中的訓練集,然後是整個訓練集之間的區別是什麼?
- 28. 使用大型數據集在Spark上訓練BloomFilter
- 29. 使用預測模型和TunePareto包測試和訓練數據集
- 30. 如何使用較小的數據集訓練Google Inception-v3模型?
非常感謝。如果我找到其他有用的數據集,我會在這裏發表評論。 –
我嘗試通過聚集手套向量並使用名稱標記每個羣集來創建具有標記實體的自己的數據集。你認爲這是一個正確的方法嗎? –
聽起來很像,但我還沒有玩過這個東西,但還沒有確定。而且現在看起來我現在不會再回到這裏了,因爲我已經被分配到另一個項目了。你暫時獨立。對不起:( –