named-entity-recognition

    -4熱度

    1回答

    我有一個數據集的單詞和文本,我想使集羣(通過K均值)或任何其他無監督/監督學習方法來區分單詞,例如,單詞'約翰'將被分類作爲一個名稱(並將與其他人的名字聚集在一起),'巴西'作爲一個地方等等。 有沒有我可以用來解決問題的模型。 我聽說過的n-gram,但我不知道如何繪製在X,Y情節或等 P.S的n元語法的概率,如果你有這將是美妙的

    0熱度

    1回答

    人們有沒有想過構建NER模型來標記地址或時間表達式的文本序列? 有一個時間表達式的解析器,如「最後五天」,稱爲SUTime:http://nlp.stanford.edu/software/sutime.shtml。不幸的是,它是越野車,並建立了大規模的規則。 解析地址更加困難且容易出錯。 CoreNLP解析器無法解析簡單的事情,如Mountain View,CA. 我覺得應該有一種方法來訓練RN

    1熱度

    1回答

    我是新來的NLP場景,並且正在使用OpenNLP 1.5入門。 https://opennlp.apache.org/documentation/manual/opennlp.html (我使用命令行界面上手) 我以前已經提供的樣品模型,使用不同的工具進行試驗和: 我通過一些文件在這裏給出的命令去最後決定創建一個定製NER型號。 我遵循上述鏈接給出的指示。 複製給到.train文件樣本句子(我簡單

    2熱度

    2回答

    我有170本荷蘭文學小說的語料庫,我將在其上應用命名實體識別。對於荷蘭語的現有NER標籤的評估,我想手動註釋這個語料庫的隨機樣本中的命名實體 - 爲此我使用brat。手動註釋的隨機樣本將作爲我評估NER標籤的「黃金標準」。我寫了一個Python腳本,在句子級別輸出我的語料庫隨機樣本。 我的問題是:根據每部小說的句子數量,隨機樣本的理想大小是多少?就目前而言,我每條小說使用了100個句子,但是這導致

    0熱度

    1回答

    我正在使用stanford coreNLP [stanford-ner-2015-12-09]和python nltk StanfordNERTAgger,但它的效果不同於在線演示。 我經歷了這個線程「https://mailman.stanford.edu/pipermail/java-nlp-user/2011-August/001283.html」,它說「他們使用相同的模型,但CoreNLP

    1熱度

    2回答

    我試圖將實體提及鏈接到知識庫,例如DBpedia或Wikidata。 最後,我要豐富JSON輸出任意本體,並在此提供某種語義。但作爲第一步,它應該只是看起來像這樣: { "index": 1, "mention": "Barack Obama", "characterOffsetBegin": 0, "characterOffsetEnd": 12,

    -1熱度

    3回答

    準備訓練語料爲CRF模型 我需要在以下格式 (u'Melbourne', u'NP', u'B-LOC'), (u'(', u'Fpa', u'O'), (u'Australia', u'NP', u'B-LOC'), (u')', u'Fpt', u'O'), (u',', u'Fc', u'O'), 我有的只是txt文件,我需要這個數據CRF模型NER任務數據。 我打算爲pytho

    1熱度

    1回答

    建議 我的文檔通常包括像句: 假如我知道關於這一點,我會避免這個問題 或 如果約翰通知,這不會發生 或 這不會是一個問題,如果傑森智能 我感興趣的提取這些類型的信息(不知道他們叫什麼,語言)。所以我想,用於提取整個句子,或理想,一個總結,如: (通知約翰)(防止) 大多數,如果不是全部,關係抽取的例子,我所遇到的信息抽取,遵循相當標準的流程: 做NER,然後關係抽取查找像「in」或「at」等關係(

    0熱度

    1回答

    example training excersize用類似簡單的split(' ')這樣的東西標記後標記單個名詞。 我需要訓練並識別包含空格的名稱。我如何訓練識別器? 例如:「我看到一棵大紅蘋果樹。」 - 我如何標記培訓,然後識別「大紅蘋果樹」而不是識別四個單獨的單詞? 這是否適用於培訓數據? I\tO saw\tO a\tO Big Red Apple Tree\tMyName .\tO

    0熱度

    1回答

    我處理純文本文件,並像識別文檔中存在的學院/大學名稱的實體。有些時候這些名字是用不同的格式寫成的,但它們是指一個大學/大學的名字。 例子: 賈瓦哈拉爾尼赫魯科技大學海得拉巴 J.N.T.U海德拉巴 JNTU海德拉巴 JNTU-H 賈瓦哈拉爾尼赫魯科技大學(JNTU)海得拉巴 所有上述名稱是指同一所大學的名字。 我們如何能與所有這些名字到一個學院/大學的名字? (我正在尋找某種Web服務或類似Goo