opennlp

    0熱度

    1回答

    爲什麼輸入myCategorizer.categorize();必須是apache opennlp 1.8中的String [],而不是像apache OpenNLP 1.5版中的字符串? 因爲我想檢查單獨的字符串而不是數組。 public void trainModel() { InputStream dataIn = null; try {;

    0熱度

    1回答

    我試圖用下面的代碼來訓練一個模型,但我一直收到DocumentCategorizerME.train()方法的錯誤,它告訴我將factory更改爲doccatfactory。爲什麼? public void trainModel() { DoccatModel model = null; InputStream dataIn = null; try {

    2熱度

    1回答

    所以我終於OpenNLP納入我的項目,我已經成功培訓了15,000行的訓練數據的我的模型,將其存儲,並且可以加載它,當我想用它來識別我的程序中的實體! ,我用它來識別井號標籤,所以我的訓練數據看起來是這樣的: ... Jim , I know you to be a fighter <START:HASHTAG> #usmarine <END> @ USMC Kira has your

    1熱度

    2回答

    我有許多美國學校年鑑的人臉肖像和名稱的掃描頁面。來自頁面的所有文本都是OCR化的並且每個頁面以多個版本收集: 非結構化文本文件。 Example Xml帶有每句話的座標。 Example 帶有每個單個字母的座標的Xml。 Example 的目標是,以確定哪些文本字符串代表的人的名字,並將其與人像有關。問題在於每一本年鑑都是獨一無二的,每一頁都可能是獨一無二的,所以沒有共同的模式可以應用(但可能有一

    1熱度

    1回答

    我正在嘗試向nl-personTest.bin文件添加額外的訓練數據,其中OpenNLP。 現在是我的問題,當我運行我的代碼添加額外的訓練數據時,它將刪除已經存在的數據並只添加我的新數據。 如何添加額外的訓練數據而不是替換它? 我沒有使用下面的代碼,(得到它來自Open NLP NER is not properly trained) public class TrainNames {

    1熱度

    1回答

    此刻我試圖在文檔中查找名稱。即時通訊使用下面的方法來找到名字: find(String[] tokens) 我也發現了下面這個方法: find(String[] tokens,String[][] additionalContext) 我可以做什麼用這種方法,如何使用它?

    -4熱度

    1回答

    我需要在我的應用程序中創建搜索引擎。當用戶輸入例如「購買100只白色蝙蝠俠T恤」,它應該自動打開填充有輸入的頁面(頁面購買 - >文章:蝙蝠俠T恤,數量:100,顏色:白色)。 此外,如果用戶鍵入「買入」,它應該是像「買入」或類似的一些建議.. 我試圖完成的是機智NLP(阿帕奇openNLP +英語),但我可以」完全解決它。任何建議,我應該使用什麼,我應該採取哪種方法?

    1熱度

    1回答

    我試圖在openNLP 1.8版中構建分類程序,但代碼如下,我不斷收到NullPointerException。我究竟做錯了什麼? public class test { public static void main(String[] args) throws IOException { InputStream is = new FileInputStr

    1熱度

    1回答

    我正在將text和text從tables寫入word文檔。 使用以下代碼將tables放置在正確的paragraphs下。 Iterator<IBodyElement> iter = xdoc.getBodyElementsIterator(); while (iter.hasNext()) { IBodyElement elem = iter.n

    -1熱度

    1回答

    什麼是權衡設置: params.put(TrainingParameters.ITERATIONS_PARAM, "100"); 什麼設置10節100或1000實際上呢? 謝謝