2011-10-03 82 views
5

我正在通過這個plagiarism detector並嘗試在Haskell中編寫一個程序,它將讀取一個文件並用同義詞替換它的一些單詞。 Haskell中有沒有可用於此目的的字典?另外,如果您有任何關於算法或與此問題相關的任何其他輸入的任何輸入,例如如何避免通過用同義詞替換單詞來更改語句的上下文,請將其發佈。在Haskell中用同義詞替換單詞

回答

3

Haskell有沒有可用於此目的的任何字典?

我會想象你正在尋找的是一個純文本文件,這樣的事情:

word1: word1synonym1, word1synonym2, ... 
word2: word2synonym1, ... 
... 

在這種情況下,它不會真的是哈斯克爾特定的。我不知道任何這樣的自由文本文件,但我想象如果你挖掘LibreOffice你可能會找到一個。

如何避免由它的同義詞

這是非常困難的一臺計算機做的,據我所知替換單詞更改語句的上下文。我建議不要在這方面花費很多精力。

對於任何輸入算法

您可能會發現的edit distance這個問題有用的概念。見Approximate string matchingWagner-Fischer algorithm

+2

其實,這裏有一個庫:http://wordnet.princeton.edu –