好吧,我有下面的代碼從OpenNLP如何在OpenNLP中訓練指定的實體識別器標識符?
FileReader fileReader = new FileReader("train.txt");
ObjectStream fileStream = new PlainTextByLineStream(fileReader);
ObjectStream sampleStream = new NameSampleDataStream(fileStream);
TokenNameFinderModel model = NameFinderME.train("pt-br", "train", sampleStream, Collections.<String, Object>emptyMap());
nfm = new NameFinderME(model);
我不知道如果我做錯事,如果事情是缺少訓練NER標識符,但分類不工作。我假設train.txt是錯誤的。
發生的錯誤是所有標記都被分類爲只有一種類型。
我的train.txt數據類似於下面的例子,但具有更多的變化和數量的條目。另一件事是我每次都從文本中逐字分類,而不是所有的標記。
<START:distance> 8000m <END>
<START:temperature> 100ºC <END>
<START:weight> 50kg <END>
<START:name> Renato <END>
有人可以證明我做錯了什麼?
你能告訴我,你使用的是什麼版本的OpenNLP?因爲我使用OpenNLP 1.5.1,並且沒有用於溫度,距離和重量的模型文件。 – 2011-11-09 11:49:13
@ raj.singh我沒有使用OpenNLP。我爲我的目的編寫我自己的分類器。 –
嗨@Renato Dinhani,我有同樣的問題,你能幫助我,你如何在你的應用程序中解決這個問題。我得到這個錯誤,當我要去我們的train.txt異常:java.security.NoSuchAlgorithmException –