similarity

5熱度

2回答

我需要MySQL代碼來檢查通過表單提交的文本與存儲在MySQL數據庫中的多個文本之間的相似性百分比。我正在尋找能夠像PHP的similar_text()函數一樣工作的MySQL存儲過程。已經有MySQL Levenshtein距離程序，但這還不夠。當用戶提交的算法應該相似提交的案文給出的回報率在數據庫中的任何條目中的文本（它會比較只有一個數據庫列），例如從具有相似性> 40％數據庫返回的所有條

1熱度

1回答

Wordnet ::相似服務器：如何與Java交談？

我在我的Ubuntu上安裝了WordnetSimilarity server。我用命令啓動它： $ similarity_server.pl --logfile server.log 現在我想從我的Java/Groovy的應用程序使用它，我寫了這個代碼來獲取服務器版本： // open connection Socket kkSocket = new Socket("localhost",

3熱度

3回答

如何在使用Python的Wordnet中查找相關性

我想用Python找到兩個單詞之間的相關性（不相似）。在Perl here中實現了hso（Hirst和St-Onge，1998），lesk（Banerjee和Pedersen，2003）和vector（Patwardhan，2003）算法，但是我似乎在nltk lib中找不到Python。我需要使用Python，因爲它是Python中較大團隊項目的一部分。任何線索？

1熱度

1回答

獲取文本的類別

我想選擇文本類型（文章）（例如sport，economic），字符串，並且我想知道是否使用函數similar_text（）或其他方法的最佳方式。我需要比較文本。一篇文章是應該分配給類別的描述。第二個文本實際上是描述類別的所有關鍵詞的文本。比較給定相似百分比的兩個文本。與特定類別最相似的文本實際上就是該類別。我應該做這個密碼similar_text（）或其他嗎？（soory for my eng

-3熱度

2回答

比較兩個整數的相似

例子： number1 = 54378 number2 = 54379 if number1 (is similar to) number2: print (number1 + " " + number2) input("what to do") 我想這兩個數字之間的比較，並讓當這種（數字1和數字2之間）發生了相似的計劃通知我。我想解決方案是靈活的，有更多的相似空間（

1熱度

1回答

如何找到二維數組所有列的最佳匹配？

比方說，我有一個二維數組，看起來像： ________________ |10|15|14|20|30| |14|10|73|71|55| |73|30|42|84|74| |14|74|XX|15|10| ---------------- 正如我發現，列不必是相同的尺寸。現在我需要找到每列最好的匹配（最完全相同的項目和最低的不同）。當然，我可以在n^2中做到這一點，但對我來說太慢

1熱度

1回答

高效地選擇一個標題（集羣的中心）的字符串

的羣集我有一個（不完全）聚集串數據，其中在一個集羣中的項目可能是這樣的： [ Yellow ripe banana very tasty, Yellow ripe banana with little dots, Green apple with little dots, Green ripe banana - from the market, Y

2熱度

1回答

「個性測驗」風格比較[PHP]

我想要一個高效或合理的算法來獲取用戶提交的測試結果，並將它們與幾個配置文件的值進行比較以找到匹配網上約會服務如何與適合的伴侶的答案相匹配）。我真的不知道如何去做這件事。如果用戶回答10個有關自己的問題，並且有10個候選人與他匹配，則我們正在通過數據庫查看數千個比較結果。必須有更好的方法來做到這一點。在我所做的研究中，也許我可以用Levenshtein距離函數來完成這項工作，但我不知道該怎麼做，

6熱度

5回答

在文本中查找相關單詞的算法

我想要一個單詞（例如「Apple」）並處理一個文本（或者更多），我想提出相關術語，例如：處理文檔蘋果和發現的iPod，iPhone，Mac是關係到「蘋果」條款。如何解決這個任何想法？

0熱度

4回答

比較字符串數組的相似性

我可以使用數百個JSON字符串。其中每個包含15-20個字的數組，按照一定的重量排序。如果值得注意的話，這個重量是這些詞在一些文本塊中找到的次數。找出像這樣構造的單詞陣列之間的相似性的最佳方式是什麼？我頭腦中的第一個想法是創建所有單詞的數值散列，並基本比較這些值以確定相似性。我並不是非常成功，因爲非常相似的字符串所產生的散列值並不是非常接近。經過一些關於字符串比較算法的研究，我來到Stackov