我是斯坦福核心NLP的新手。我想用它來分割英文,德文,法文文本中的句子。這個工作在哪一類?提前致謝。stanford核心NLP:從文本中拆分句子
回答
對於處理此問題的較低級別的類,您可以查看tokenizer documentation。在CoreNLP級別,您可以使用Annotator的「標記化,ssplit」。
爲什麼不使用BreakIterator
從java.text
包......拆分句子,行,字,字符...等
請參閱此鏈接:
http://docs.oracle.com/javase/6/docs/api/java/text/BreakIterator.html
它以前不知道它。我會仔細看看的。謝謝。 – thetna
不客氣...... –
要小心,NLP解析有很多細節,像BreakIterator這樣的簡單策略可能無法正確處理。例如,你會正確處理一個句子,例如「麪包花費$ 4.99」或「怎麼回事?」問母親。「如果你對一種天真的解決方案沒問題,BreakIterator就可以做得很好。如果你想更有力地處理這些案例,斯坦福大學的NLP庫是一個好主意。 –
有你看過main Stanford NLP page上的文檔?大約一半的時候,它提供了一個你正在尋找的確切東西的例子。這個例子不僅分割句子,而且分詞。
Properties properties = new Properties();
properties.setProperty("annotators", "tokenize, ssplit, parse");
StanfordCoreNLP pipeline = new StanfordCoreNLP(properties);
List<CoreMap> sentences = pipeline.process(SENTENCES)
.get(CoreAnnotations.SentencesAnnotation.class);
// I just gave a String constant which contains sentences.
for (CoreMap sentence : sentences) {
System.out.println(sentence.toString());
}
- 1. stanford核心nlp java輸出
- 2. Stanford核心NLP英語語言模型
- 3. 句子意義分數和詞頻分佈stanford-nlp
- 4. 核心NLP中的getOpenIE方法的句子索引R
- 5. stanford nlp tokenizer
- 6. Stanford NLP安裝
- 7. Stanford NLP - NER&Models
- 8. 從拆分句子
- 9. 從文本中刪除停用詞是否會影響stanford核心nlp NER性能?
- 10. 如何使用Stanford NLP替換句子(CoreMap)中的令牌(CoreLabel)?
- 11. 將文本文件拆分成句子
- 12. 如何在java中使用stanford nlp從句子中只提取名詞短語?
- 13. JS將文本拆分成句子
- 14. 將文本段落拆分成句子
- 15. 將文本拆分成句子
- 16. 使用stanford nlp發現一個句子的時態
- 17. stanford nlp分類器的輸出
- 18. 斯坦福核心NLP
- 19. 核心nlp truecaseannotator找不到
- 20. CoreNlp拆分stanford-corenlp-3.2.0-models.jar
- 21. 核心文本分頁符
- 22. Stanford NLP解析樹格式
- 23. Stanford Core NLP LexicalizedParser模型
- 24. java.lang.NoClassDefFoundError:edu/stanford/nlp/parser/lexparser/LexicalizedParser
- 25. Stanford NLP Parser Model Jar太大
- 26. 在standford核心中獲取位置nlp
- 27. 拆分句子期
- 28. 如何使用不飽和核心的z3拆分子句並嘗試找到不再核心再次
- 29. 核心文本 - 從ctrunref
- 30. NLP - 句子主語
從管道中獲取結果句子列表的最簡單方法是什麼?我可以得到列表,但不知道如何獲得列表句子。 –
我找到了解決辦法:做「sentence.get(TextAnnotation.class);」句子是一個CoreMap。 –