我正在嘗試OpenNLP句子檢測工具。文本位於文件 - para3.txt中。內容:OpenNLP句子檢測
Bob went to London Mary came from Paris Now everything is fine.
我用下面的命令運行以下命令:
opennlp SentenceDetector ../models/en-sent.bin < para3.txt
我得到這樣的輸出:
Bob went to London Mary came from Paris Now everything is fine.
理想情況下,我會看到三個句子作爲輸出:
Bob went to London.
Mary came from Paris.
Now everything is fine.
現在,如果我tr對於其他句子,如果存在「句號」或「句號」,則句子檢測正在發生。一個人會猜到文中有3個句子,但是如何通過OpenNLP完成? NLP的哪些工具可以幫助這裏?句子檢測的下一級是什麼?
最受訓練的句子組塊模型試圖區分出現爲完整站點的點或用於首字母縮寫詞,標題等的點。您有一個非常特殊的情況,您很可能需要使用專門技術或訓練新的模型。 –