2012-01-11 24 views
2

我要尋找一個在Java的一個工具,允許我做以下事情:尋找同義詞和傾斜詞的基本形式

1)求傾斜字的基本形式。例如:

  • 對於「連接」,「連接」,「連接」等字樣,它將返回單詞「連接」。
  • 對於「運行」一詞,「運行」它將返回單詞「運行」。

2)爲每個單詞返回它的同義詞集合。

有人知道這樣的工具嗎?

回答

2

我假設你只關心英語。

您遇到的第一個問題叫做stemmingSO post推薦使用Porter stemmer的Java實現。

WordNet有一個非常大的人類創建/策劃的單詞及其關係數據庫,其中包括同義詞等。這是一個Java API to WordNet

+0

這個Porter stemmer對於普通動詞非常好,但對於V3動詞卻失敗了。有沒有一種工具可以完成成功的V3分析? – 2012-01-16 17:51:14

+0

它也失敗了其他動詞,如暫停例如。 – 2012-01-16 17:54:37