opennlp

    1熱度

    1回答

    我使用OpenNlp的訓練API識別了我教授的技能,訓練了一個含有超過一百萬個句子的自定義NER模型。在測試過程中,我發現識別技能和技能子串的模型。例如,我已經教了一門技能'Core Java',如果句子有'Core'這個詞,那麼我的模型會將其識別爲一項技能。我想避免這種情況。如果整個單詞出現在測試語句中,我只想識別出'Core Java'這個單詞。 如何提高我的自定義模型爲上述結果?

    1熱度

    2回答

    我試圖用openNLP上可在這裏moview審覈數據集上的情感分析工作:http://www.cs.cornell.edu/people/pabo/movie-review-data/(極性數據集V2.0) 我如何可以訓練文檔分類模型,利用該openNLP數據集? 它由相當數量的評論組成,已被列爲不同的文件夾集。 openNLP需要輸入一個文件,每個檢查都帶有一個帶有類別標籤前綴的新行。我正在尋找

    1熱度

    1回答

    對不起,我是新手在NLP。 我使用opennlp創建AI,以便將同義詞放入原始文本中並將它們顯示給網站。 例如:如果我按:我去學校,AI會告訴我「去」的同義詞,「大學」或「高中」的「學校」同義詞 我嘗試使用named實體識別爲此目的,但它不可能。 任何人都可以幫助我嗎?

    0熱度

    1回答

    我需要比較下面的數組,並檢查是否有類似的單詞,如果有類似的單詞,然後執行另一個任務。這裏的tockanization我已經使用Apache open NLP。 import opennlp.tools.tokenize.SimpleTokenizer; public class SimpleTokenizerExample { public static void main(Strin

    1熱度

    1回答

    我在嘗試創建自定義模型時遇到了一個問題。問題是我創建了一個基於培訓文件的自定義模型,培訓成功。 但是,當我使用樣本輸入測試模型(實際上是從訓練文件本身獲取它)時,這不會給出任何輸出。 我甚至嘗試了超過15000個句子,但它從來沒有給我一個輸出。 1.代碼嘗試: - package com.tcs.ai.opennlp.anothercustommodel.anothercustommodel;

    0熱度

    1回答

    我正在使用我正在爲自己的用例進行培訓的自定義模型。我的用例是根據它是否是地址變更請求來分類電子郵件。如果地址變更請求可以從一個句子中理解,它可以正常工作,沒有問題。但是,如果地址變更請求需要從多個句子中理解,則不起作用。 給予幾個例子如下: - 例1: - 這是工作一)培訓文件: - Guys I wish to <START:contactupdate> change my address <E

    0熱度

    1回答

    運行我的Java Web應用程序時出現錯誤。在這裏我有一個servlet類和一個用於Apache openNLP文本分析的類。以下是我的這兩個類的2個代碼。 01. My servlet Class code 02. My OpenNLP Class code 當我運行這段代碼(提交我的表單數據與Servlet)我得到下面的錯誤代碼在瀏覽器中 而且它顯示了以下異常詳細信息在eclipse控制檯中。

    1熱度

    1回答

    如何將OpenNLP模型添加到我的Java Web應用程序類路徑中?我只是將「en-parser-chunking.bin」文件複製到我的Java Web應用程序src文件夾中。但它給了我沒有發現異常的類。在tomcat 9中將這個文件添加到我的類路徑中的正確方法是什麼? Open NLP Tools Models

    1熱度

    1回答

    我正在嘗試使用OpenNLP對發票進行分類。根據它的描述,我將它分成兩類。我已經構建了一個包含20K描述的培訓文件,並將其標記爲正確的類。 訓練數據看起來像(第一列是一個代碼,即我的類中使用,而第二列是發票說明): 85171231 IPHONE 5S CINZA ESPACIAL 16GB (ME432BZA) 85171231 Galaxy S6 SM-G920I 85171231 mot

    1熱度

    2回答

    我正在嘗試使用某些nlp技術在以下文本行中找到課程。 from nltk import word_tokenize, pos_tag, ne_chunk sentence = "SDGI is offering courses like Electronics,Mechatronics, Physics,Mechanical Engineering" print ne_chunk(pos_t