0
根據文檔,我可以使用諸如ssplit.isOneSentence之類的選項來將我的文檔解析爲句子。鑑於StanfordCoreNLP對象,我究竟該怎麼做?對CoreNLP使用ssplit選項
這裏是我的代碼 -
Properties props = new Properties();
props.setProperty("annotators", "tokenize, ssplit, pos, lemma, ner, depparse");
pipeline.annotate(document);
Annotation document = new Annotation(doc);
pipeline.annotate(document);
List<CoreMap> sentences = document.get(SentencesAnnotation.class);
在哪一點我添加此選項,在哪裏? 這樣的事情?
pipeline.ssplit.boundaryTokenRegex = '"'
我也想知道如何使用它的特定選項boundaryTokenRegex
編輯:
我覺得這似乎更合適 -
props.put("ssplit.boundaryTokenRegex", "/"");
但我仍然必須驗證。