named-entity-recognition

    1熱度

    1回答

    是否有任何現有的帶標記實體的數據集來訓練MITIE模型? 我檢查了鏈接,https://github.com/mit-nlp/MITIE/blob/master/examples/python/train_ner.py只用兩個樣本訓練模型。是否有任何現有的帶標記實體的數據集要訓練?

    0熱度

    1回答

    我正在訓練一個自定義命名實體識別(NER)模型中使用NeuroNER這是使用張量flow.I寫我能夠訓練模型及其表現良好,但是當我重新訓練它新的觀察,它顯示不正確的結果它糾正它們,但其影響/遺忘一些以前的觀察它顯示正確的結果。 我想在線再訓練。我嘗試使用stanfordNLP,Spacy,現在tensor-flow.please提出了一個更好的方法來達到預期的目標。 謝謝

    2熱度

    1回答

    所以我終於OpenNLP納入我的項目,我已經成功培訓了15,000行的訓練數據的我的模型,將其存儲,並且可以加載它,當我想用它來識別我的程序中的實體! ,我用它來識別井號標籤,所以我的訓練數據看起來是這樣的: ... Jim , I know you to be a fighter <START:HASHTAG> #usmarine <END> @ USMC Kira has your

    1熱度

    2回答

    我有許多美國學校年鑑的人臉肖像和名稱的掃描頁面。來自頁面的所有文本都是OCR化的並且每個頁面以多個版本收集: 非結構化文本文件。 Example Xml帶有每句話的座標。 Example 帶有每個單個字母的座標的Xml。 Example 的目標是,以確定哪些文本字符串代表的人的名字,並將其與人像有關。問題在於每一本年鑑都是獨一無二的,每一頁都可能是獨一無二的,所以沒有共同的模式可以應用(但可能有一

    0熱度

    1回答

    我一直在探索使用預訓練的MITIE模型進行命名實體提取。無論如何,我可以看看他們的實際模型而不是使用預訓練模型嗎?該模型是否可用作開源軟件?

    0熱度

    1回答

    嗨,我是新來的python,並試圖運行腳本(https://github.com/detuvoldo/tagger),我取代了utils.py中的2行,因爲我使用的是Windows 10,路徑相關的問題。 models_path = u"\\\\?\\" + os.path.abspath(u".\\models") eval_path = os.path.abspath(u".\\evalua

    2熱度

    1回答

    我使用Python包裝斯坦福NLP 的代碼,以查找命名實體是: sentence = "Mr. Jhon was noted to have a cyst at his visit back in 2011." result = nlp.ner(sentence) for ne in result: if ne[1] == 'PERSON': print(ne) 輸出

    0熱度

    1回答

    我正在從文檔(pdf)中進行命名實體提取。每個PDF包含組實體(近16個不同類型的實體) 這裏是我的步驟,構建NLP和ML車型: Step 1:分析文檔。有近2百萬令牌(單詞)。用這些詞和CBOW方法構建word2vec模型。 Step 2:通過使用word2vec模型,生成向量的單詞在douments。 Step 3:根據域,我爲培訓,驗證和測試標記單詞(向量)。 Step 4:帶標籤的數據,訓

    1熱度

    1回答

    我正在研究一個簡單的基於語法的分析器。爲此,我需要首先標記輸入。在我的文章中出現了很多城市(例如紐約,舊金山等)。當我使用標準的nltk word_tokenizer時,所有這些城市都會被拆分。 from nltk import word_tokenize word_tokenize('What are we going to do in San Francisco?') 電流輸出: ['W

    1熱度

    1回答

    我對NER和提取和編程一般都是新手。我正在設法找出一種方法,可以提取某些文檔的截止日期和開始日期。有沒有辦法做到這一點?我可以開始的地方?我一直在看,但我遇到的問題是一樣的。可以提取日期,但不能確定日期是到期還是過帳。如果它只有一個日期,它是過帳還是到期。像這樣的東西。任何幫助,將不勝感激。 例子: 「在中世紀亞洲徵文9月3日,是由於」。 「你在4月6日給出的最後一項任務應該在10天內提交。」 「