named-entity-extraction

    10熱度

    3回答

    什麼是從自由文本中提取位置的推薦方法? 我能想到的是使用正則表達式規則,比如「位置中的單詞...」。但是有沒有比這更好的方法? 另外我可以想象有一個國家和城市名稱的查找哈希表,然後比較每個從文本提取的標記到哈希表。 有沒有人知道更好的方法? 編輯:我試圖從推文文本中提取位置。因此,大量推文的問題也可能影響我對方法的選擇。

    1熱度

    1回答

    如何鏈接條款(關鍵字實體)其中有一些關係其中通過文本文件。示例是google當您搜索某個人時,它顯示建議其他與該人相關的人。 在這張照片想通了配偶,總統候選人,並等於指定 我使用頻率計數技術。 出現在同一文件中的越多,它們之間的關係就越有可能。但是,這也會在文本文檔中鏈接無關的術語,如頁面標記,動詞和頁面回覆。 我應該如何改進它,是否還有其他簡單但可靠的技術?

    2熱度

    2回答

    我試圖使用斯坦福NLP實現NER(命名實體提取)。 的最終目標是將自由文本轉換爲查詢格式。 我創建了一個自定義詞典和我能夠提取的實體,並建立查詢 people who are from newyork 我將建立查詢 select * from people where region = 'newyork' 但在聲明中被否定 人誰的問題來不是從紐約 如何從這個聲明中提取負面情況,有沒有任何

    0熱度

    1回答

    我剛開始使用NLTK,我認爲我需要完成的任務非常簡單。 我需要解析一些文檔,並提取對某些實體的情緒。例如以下句子的整體情緒: Tea is great. However, I hate coffee. 是負數,但我想提取單個預定義實體的情緒。特別是,在前面的例子中,我想用我的實體('tea', 'coffee')來提供NLTK,並能夠分別提取sentiment('tea')和sentiment

    0熱度

    1回答

    我想解析包含時間,地點和名稱的網頁中的實體。我讀了一些關於自然語言處理和實體提取的內容,但我不確定我是否正走向錯誤的道路,所以我在這裏問。 我還沒有開始實現任何東西,所以如果某些開源庫僅適用於特定語言,那沒關係。 很多倍的數據不會在句子中找到,而是像列表HTML的結構(例如 2013年2月1日 - 事件的名稱 - 競技場名稱 )。 網頁的結構將大不相同(有些可能使用列表,有些可能會將它們放在表格中

    1熱度

    1回答

    我使用Vowpal Wabbit的python API來訓練名稱實體識別分類器,以從短句子中檢測人員,組織和位置的名稱。我已經編制了一份IPython Notebook,詳細介紹了數據,如何訓練模型以及評估句子中的實體。培訓數據來自ATIS和CONLL 2003數據集。 我Vowpal Wabbit SearchTask類(基於this tutorial)的設置: class SequenceLa

    19熱度

    3回答

    最近我一直試圖用斯坦福核心NLP訓練n-gram實體。我遵循以下教程 - http://nlp.stanford.edu/software/crf-faq.shtml#b 使用此功能,我只能指定單字符標記及其所屬的類。任何人都可以引導我,讓我可以將它擴展到n-gram。我試圖從聊天數據集中提取已知的實體,如電影名稱。 如果我錯誤地解釋了斯坦福教程並且可以用於n-gram培訓,請指導我。 什麼我堅持

    0熱度

    1回答

    我試圖使用Apache Tika解析一些文檔(如文件類型中列出的)。這是我在Python中的代碼。 auth = urllib2.HTTPPasswordMgrWithDefaultRealm() auth.add_password(None, url, user, password) urllib2.install_opener(urllib2.build_opener(urllib2.HT

    -1熱度

    2回答

    我目前正在學習項目中從個人簡歷中提取個人姓名。 目前,我正在與斯坦福大學NER和OpenNLP合作,這兩種方法在開箱即用方面都取得了一定的成功,傾向於在「非西方」類型名稱(沒有針對任何人的攻擊)上掙扎。 我的問題是 - 定的普遍缺乏句子結構或上下文相對於一個人的名字在CV /簡歷,我是可能獲得通過創建一個CV語料庫一些類似於在名稱標識任何顯著的改善? 我最初的想法是,我可能有一句分裂一個更大的成功

    0熱度

    1回答

    我有一個超過200萬名稱,階段,位置等數據庫/字典。示例數據如下: 「A person who never made a mistake never tried anything new」 「Nelson Mandela」 「United States of America」 「I didn't attend the funeral, but I sent a nice letter