opennlp

0熱度

1回答

爲什麼輸入myCategorizer.categorize（）;必須是apache opennlp 1.8中的String []，而不是像apache OpenNLP 1.5版中的字符串？因爲我想檢查單獨的字符串而不是數組。 public void trainModel() { InputStream dataIn = null; try {;

0熱度

1回答

訓練分類模型Opennlp

我試圖用下面的代碼來訓練一個模型，但我一直收到DocumentCategorizerME.train()方法的錯誤，它告訴我將factory更改爲doccatfactory。爲什麼？ public void trainModel() { DoccatModel model = null; InputStream dataIn = null; try {

2熱度

1回答

定製OpenNLP名稱查找在訓練集識別數據，而不是測試組

所以我終於OpenNLP納入我的項目，我已經成功培訓了15,000行的訓練數據的我的模型，將其存儲，並且可以加載它，當我想用它來識別我的程序中的實體！，我用它來識別井號標籤，所以我的訓練數據看起來是這樣的： ... Jim , I know you to be a fighter <START:HASHTAG> #usmarine <END> @ USMC Kira has your

1熱度

2回答

從非結構化年鑑文本中提取人名

我有許多美國學校年鑑的人臉肖像和名稱的掃描頁面。來自頁面的所有文本都是OCR化的並且每個頁面以多個版本收集：非結構化文本文件。 Example Xml帶有每句話的座標。 Example 帶有每個單個字母的座標的Xml。 Example 的目標是，以確定哪些文本字符串代表的人的名字，並將其與人像有關。問題在於每一本年鑑都是獨一無二的，每一頁都可能是獨一無二的，所以沒有共同的模式可以應用（但可能有一

1熱度

1回答

將訓練數據添加到現有模型（bin文件）

我正在嘗試向nl-personTest.bin文件添加額外的訓練數據，其中OpenNLP。現在是我的問題，當我運行我的代碼添加額外的訓練數據時，它將刪除已經存在的數據並只添加我的新數據。如何添加額外的訓練數據而不是替換它？我沒有使用下面的代碼，（得到它來自Open NLP NER is not properly trained） public class TrainNames {

1熱度

1回答

OpenNLP find（）方法

此刻我試圖在文檔中查找名稱。即時通訊使用下面的方法來找到名字： find(String[] tokens) 我也發現了下面這個方法： find(String[] tokens,String[][] additionalContext) 我可以做什麼用這種方法，如何使用它？

-4熱度

1回答

搜索引擎建議 - 鏈接（表格完成）

我需要在我的應用程序中創建搜索引擎。當用戶輸入例如「購買100只白色蝙蝠俠T恤」，它應該自動打開填充有輸入的頁面（頁面購買 - >文章：蝙蝠俠T恤，數量：100，顏色：白色）。此外，如果用戶鍵入「買入」，它應該是像「買入」或類似的一些建議.. 我試圖完成的是機智NLP（阿帕奇openNLP +英語），但我可以」完全解決它。任何建議，我應該使用什麼，我應該採取哪種方法？

1熱度

1回答

OpenNLP分類程序版本1.8

我試圖在openNLP 1.8版中構建分類程序，但代碼如下，我不斷收到NullPointerException。我究竟做錯了什麼？ public class test { public static void main(String[] args) throws IOException { InputStream is = new FileInputStr

1熱度

1回答

將文本和表格寫入word中，用空白/輸入

我正在將text和text從tables寫入word文檔。使用以下代碼將tables放置在正確的paragraphs下。 Iterator<IBodyElement> iter = xdoc.getBodyElementsIterator(); while (iter.hasNext()) { IBodyElement elem = iter.n

-1熱度

1回答

什麼是設置的權衡：params.put（TrainingParameters.ITERATIONS_PARAM，「100」）;

什麼是權衡設置： params.put(TrainingParameters.ITERATIONS_PARAM, "100"); 什麼設置10節100或1000實際上呢？謝謝