2017-04-14 36 views
-1

我是自然語言處理的新手。我需要根據它們的概率(例如75%及以上)來提取有意義的名詞和名詞短語來製作自動建議字典。如何使用OpenNlp的分塊解析器基於概率提取有意義的名詞短語

我一直在閱讀在線帖子,文章幾天,但只發現了一些信息。我正在考慮使用en-parser-chunking.bin 模型。

有人可以推薦覆蓋類似於上述用例的良好資源/示例嗎?

我目前的處境:

型號= EN-解析器chunking.bin

串線= 「Tutorialspoint是最大的教程庫」; (NP(NN Tutorialspoint))(VP(VBZ is)(NP(DT the)(JJS largest)(NN tutorial)(NN library。)))) )

Noun_Probability:

Tutorialspoint_0.4482373645195041 tutorial_0.6801141071099344 library._0.5625105229675064

回答

1

我不認爲這種做法是很好的。建議您可以嘗試:使用OpenNLP Chunker而不是Parser(它速度更快)。在大語料庫中運行並提取名詞短語及其頻率。也許頻率會提示如何建立你的字典。

+0

謝謝,wcolen! 是的,我也注意到解析器組塊的緩慢。現在將嘗試OpenNLP Chunker。 – Wendy

相關問題