1

我怎麼能說如果兩篇關於同一事件,但在語法和邏輯上不同的文章是相同或不同的。如何說如果兩篇關於來自不同來源的同一事件的文章使用AI相同?

例子:

案例1

  • 第1條(新聞來源1):美國貿易赤字上升,本財

  • 第2條(新聞源2):美國貿易逆差上升

結果:兩者是同一

案例2

  • 第1條(新聞來源1):哈佛大學今年有年輕的學生。

  • 第2條(新聞來源2):哈佛今年的入學變得更加艱難。

結果:它們是不同的。

不是單詞到單詞匹配,而是作爲一個整體。如果我們可以做意義比較,那就更好了。 我使用哪個AI概念,如果任何人都可以分享一些關於這個概念的信息會有所幫助。我被告知Natural Language Processing可能會有所幫助。請幫忙!! PS:請告訴我是否有相同的開源API。

+0

也看看http://stackoverflow.com/questions/9540315/mysql-find-how-different-two-text-fields-are – hsmit

回答

1

首先,看看the Levenshtein distanceedit distance。 這可以幫助您創建「不同」兩個字符串(或文本)的度量。

對於更高級別的比較,您需要考慮語義確實。我認爲WordNet提供了語言的語義,可以幫助您比較單詞。 see example

+0

謝謝......我認爲WordNet服務於我的目的..是還有其他類似的API嗎? – sathish

+0

@ user2513500:http://www.princeton.edu/wordnet/related-projects/ – hsmit

相關問題