2015-09-01 85 views
1

給定每個包含Y值的X個集合,我如何找到最常用的集合? (不確定如果常見的是正確的字)找到最常見的一組值

作爲一個例子我有6組,每組含5個值:

A B C D E 
A A D L G 
G A B D F 
A A I F G 
A A D F G 
A B E F G 

我將如何去尋找其涉及其他人的大部分集,作爲:

A A D F G 

這種統計是否有名字?

+0

你有什麼相似的標準? – yossico

+0

我想檢索與其他集合最相似的集合。這是你的意思是相似性標準? – Luis

回答

0

對於每個集合,計算其自身與其他集合之間Levenshtein距離的總和。 總和最小的集合是與其他集合最相似的集合。您可以選擇使用動態編程來提高程序的效率。

+0

這絕對是朝着正確方向邁出的一步,我將用於下一步,然後找到最不常見的設置。 – Luis

+0

這只是具有最大總和的集合。 – happymeal

+0

你會如何忽略Levenshtein距離序列的順序? – Luis