named-entity-recognition

    0熱度

    1回答

    我使用了幾個NER工具來提取出現在語料庫中的命名實體,我想使用NLTK Python模塊測試它們的準確性。 一些我所使用的工具有: NTLK 斯坦福NER:https://nlp.stanford.edu/software/CRF-NER.shtml MeaningCloud:https://www.meaningcloud.com/products/topics-extraction 爲了獲得系

    1熱度

    1回答

    Ive得到了480個電子郵件和他們每個人由一個或所有這些值的: - [人,學歷,工作/不工作,角色] 因此,例如電子郵件的一個看起來是這樣的: - Hi Amy, I wanted to discuss about Bob. I can see that he has a degree in Computer Science which he got three years

    0熱度

    1回答

    我有一個要求,從給定的文本中檢測公司名稱。我已經訓練了CRFClassifier,以及我的訓練數據和憲報數據。在訓練分類器後,當我使用測試數據時,要識別公司它沒有正確檢測。如果我給出了公司名稱,這是培訓數據的一部分,它能夠識別,如果我給出公司名稱是公報文件的一部分,它不能識別這些實體。你能幫助我嗎?我可以如何進一步做出正確的方向來識別實體。 屬性的文件,我使用的是這個樣子的 trainFile =

    0熱度

    1回答

    我試圖使用Apache Tika解析一些文檔(如文件類型中列出的)。這是我在Python中的代碼。 auth = urllib2.HTTPPasswordMgrWithDefaultRealm() auth.add_password(None, url, user, password) urllib2.install_opener(urllib2.build_opener(urllib2.HT

    0熱度

    2回答

    我有一組訓練刑期,我計算了一些浮動的特點。在每個句子中,兩個實體被識別。他們不是'PERSON','ORGANIZATION','LOCATION'或'OTHER'類型。我想將這些類型添加到我的功能矩陣(它存儲浮動變量)。 我的問題是:是否有添加這些實體類型,建議這樣做? 我能想到的兩種方式現在: 要麼增加兩列,一個用於每個實體,將被填充有實體類型的ID(例如,0到3個或1至4) 增加八列,每一個

    0熱度

    2回答

    我建立了一個CoreNLP服務器,並使用斯坦福NER從句子中提取時間段。 如果我使用的在線互動演示在corenlp.run解析句子 「去年發生了一些事情。」 it shows 'DATE' and '2016'。 但是,我自己的服務器搭載最新版本的CoreNLP,only shows 'DATE'。更重要的是,當我使用Python請求以相同語句查詢我的服務器的API時,響應中的前兩個令牌包含字段'

    0熱度

    1回答

    我想使用NER(CRF分類器)在查詢中標識作者姓名。我使用培訓文件training-data.col,按照nlp.stanford.edu網站中給出的方法培訓了NER。並使用該文件進行測試:testing-data.tsv。 NER將每個輸入都標記爲Author,即使是在訓練數據中標記爲非Author的數據。誰能告訴我爲什麼NER將非作者作爲作者標記爲訓練數據,以及如何訓練NER來識別作者(我有作

    1熱度

    1回答

    我使用OpenNlp的訓練API識別了我教授的技能,訓練了一個含有超過一百萬個句子的自定義NER模型。在測試過程中,我發現識別技能和技能子串的模型。例如,我已經教了一門技能'Core Java',如果句子有'Core'這個詞,那麼我的模型會將其識別爲一項技能。我想避免這種情況。如果整個單詞出現在測試語句中,我只想識別出'Core Java'這個單詞。 如何提高我的自定義模型爲上述結果?

    1熱度

    2回答

    我已經嘗試過許多NER工具(OpenNLP,Stanford NER,LingPipe,Dbpedia Spotlight等)。 但是,經常回避我的是一個基於地名詞典/字典的NER系統,其中我的自由文本與預先定義的實體名稱列表相匹配,並且可能的匹配被返回。 這樣我可以有各種像PERSON,ORGANIZATION等列表我可以動態更改列表並獲得不同的提取。這將大大減少培訓時間(因爲其中大部分都基於m

    3熱度

    1回答

    我試圖拿出一個句子,並提取Person(PER)和Place(GPE)之間的關係。 句子:「約翰來自俄亥俄州,邁克爾來自佛羅里達州,麗貝卡來自田納西州的納什維爾。」 對於最後一個人,她有一個城市和一個國家,可以被提取作爲她的地方。到目前爲止,我嘗試過使用nltk來做到這一點,但只能提取她的城市,而不是她的狀態。 我已經試過: import re from nltk import ne_chunk