2011-06-05 76 views
1

我正在尋找.net中的工具/ api,它可以粗略地提取句子中的關鍵詞。例如,如果我有一篇標題爲「PIX:世界上最薄的15英寸筆記本電腦,戴爾XPS 15z」的文章,我想提取關鍵字,例如, DELL,XPS 15z,筆記本電腦等,以便我可以在其他文章中搜索這些關鍵字並向用戶展示類似的文章。提取.net中句子中關鍵字的工具/ API

任何建議表示讚賞。

回答

0

如果你想要做搜索文本和目前相關的文章,你可能會感興趣的Lucene.NET 。它將索引一段文本並接受標準的搜索引擎式查詢。它甚至會對搜索結果進行Google風格的呈現,例如突出顯示文檔中的搜索字詞。

它比使用Tarkus提到的算法更有效,但它會解決更多的問題,並且不必編寫自己的搜索引擎(這是一項不平凡的任務)。

0

您也可以在正則表達式中使用分組來提取戴爾的文字。