2010-12-07 143 views
6

劑量任何人知道任何好的庫,在那裏爲.NET可以幫助拉出來的關鍵詞自然語言的塊。自然語言處理庫

基本上,我想去掉停用詞,而忽略時態,單複數,一般發現,在本質上是相同的話。

一些技能尋找同義詞將是很好,尤其是如果它包括諸如業務/技術/非字典單詞。

回答

4

我一直在尋找了一段時間了良好的自動標記庫。我還沒有找到一個具有所需功能的程序,但爲了創建基本文本摘要和關鍵字列表,OpenTextSummarizer的C#端口並不算太差。

+0

看起來很有趣,我得調查一下我什麼時候有點時間。謝謝 :-) – Ben 2011-01-21 10:25:43