如何使用OpenNlp的分塊解析器基於概率提取有意義的名詞短語

-1

我是自然語言處理的新手。我需要根據它們的概率（例如75％及以上）來提取有意義的名詞和名詞短語來製作自動建議字典。如何使用OpenNlp的分塊解析器基於概率提取有意義的名詞短語

我一直在閱讀在線帖子，文章幾天，但只發現了一些信息。我正在考慮使用en-parser-chunking.bin 模型。

有人可以推薦覆蓋類似於上述用例的良好資源/示例嗎？

我目前的處境：

型號= EN-解析器chunking.bin

串線= 「Tutorialspoint是最大的教程庫」; （NP（NN Tutorialspoint））（VP（VBZ is）（NP（DT the）（JJS largest）（NN tutorial）（NN library。）））））

Noun_Probability：

Tutorialspoint_0.4482373645195041 tutorial_0.6801141071099344 library._0.5625105229675064

2017-04-14 Wendy

我不認爲這種做法是很好的。建議您可以嘗試：使用OpenNLP Chunker而不是Parser（它速度更快）。在大語料庫中運行並提取名詞短語及其頻率。也許頻率會提示如何建立你的字典。

2017-04-18 13:49:23 wcolen

謝謝，wcolen！是的，我也注意到解析器組塊的緩慢。現在將嘗試OpenNLP Chunker。 – Wendy

回答