named-entity-recognition

    1熱度

    2回答

    我一直在使用斯坦福NER標記器在文檔中查找命名實體。我現在面臨的問題描述如下: - 讓句子是The film is directed by Ryan Fleck-Anna Boden pair. 現在NER惡搞標誌着瑞安作爲一個實體,斑點,安娜作爲另一個和博登作爲第三個實體。正確的標記應該是Ryan Fleck和另一個Anna Boden。 這是NER tagger的問題嗎?如果它是可以處理的?

    1熱度

    1回答

    對於文檔中的每個單詞,我希望添加一系列浮點數作爲斯坦福NER的CRFClassifier的訓練功能。不幸的是,斯坦福NER的文件.prop文件並沒有說明如何傳遞自定義功能。一般來說,如何爲斯坦福大學NER培訓集添加自定義功能?

    0熱度

    1回答

    我正在尋找一種方法來識別在Tweet文本中提到的英國大學名稱。 我有一個完整的大學名單的列表,但問題是縮短版本,如「阿萊斯韋斯Uni」,「staffs uni」(斯塔福德郡大學)或「portsmouth」(朴茨茅斯大學)。 我已經查看了Apache Stanbol和OpenNLP嘗試命名實體識別的路線,雖然這些匹配的全名我似乎無法找到一種方法來訓練它們來識別名稱的變體(或者確實是小寫未標識的名稱版

    1熱度

    2回答

    我想從文本中識別職位名稱。如何通過擴展我的小訓練數據集來創建更大的訓練數據集? 是否存在一些現成的包或擴展培訓集的開放項目?

    2熱度

    2回答

    對不起,這個奇怪的「問題標題」,但我想不出一個合適的標題。 進出口新的NLP概念,所以我用NER演示(http://cogcomp.cs.illinois.edu/demo/ner/results.php)。現在的問題是,「我如何使用NER完成這些標記的方式」如何&「。我的意思是這些答案或推論可以從這些在某些羣體中被標記的命名實體 - 位置,人員,組織等等得出。如果我有一個擁有全新公司名稱,地點等

    4熱度

    2回答

    (很抱歉,如果標題是順便一完整的紅鯡魚) 背景: 我開發地圖所有的鳴叫的在世界上真正的使用Twitter Streaming API和ASP.NET SignalR。我使用Tweetinvi C#Twitter庫異步地使用SignalR將推文推送到瀏覽器。一切都按預期工作 - 請參閱http://dev.wherelionsroam.co.uk瞭解它。 開發的下一步包括使用斯坦福自然語言解析庫(h

    0熱度

    2回答

    我下載stanford NER 3.4.1,解壓縮它,並嘗試使用默認(提供的)訓練過的模型在本地文件上運行命名實體識別。我得到了這個: `java.io.FileNotFoundException: /u/nlp/data/pos_tags_are_useless/egw4-reut.512.clusters (No such file or directory) at edu.stanford.

    0熱度

    1回答

    我正在使用Python使用斯坦福大學的NLP。所以,我有一個函數輸入一些文本文件並將它們轉換爲xml文件(由Stanford CoreNLP生成)。現在,我想編寫另一個函數來輸入這些xml文件,並輸出相應的文件,其中包含相同的文本,但命名實體替換爲它們的標記,並用「STOP」字標記句子末尾,刪除標點符號。文件的開頭也有「STOP」字樣。 給XML文件中的功能是: import subprocess

    0熱度

    1回答

    我是NLP新手。並試圖在斯坦福大學命名實體識別中發揮作用。現在,我使用Stanford NLP生成文本文件的xml文件。現在我想從xml文件中生成文本文件,以便現在用這個標籤替換已命名的實體?我應該怎麼做?有人可以幫忙嗎?

    1熱度

    1回答

    我從使用斯坦福NER CRFClassifier的新聞文章中提取命名實體,爲了實現主動學習,我想知道每個標記實體的類的置信度分數是多少。 爲例顯示: LOCATION(0.20)PERSON(0.10),組織(0.60)MISC(0.10) 這是我從文本中提取命名實體代碼: AbstractSequenceClassifier<CoreLabel> classifier = CRFClassifi