我有一堆類Puzzle的對象。我已覆蓋equals()和hashCode()。當需要向用戶展示解決方案時,我想篩選出所有「相似」的謎題(按我定義的標準),因此用戶只能看到其中的一個。 相似性是可傳遞的。 實施例: Result of computations:
A (similar to A)
B (similar to C)
C
D
在這種情況下,僅A或d和B或C將被呈現給用戶的 -
我有一組2D座標集(在每組中有100K-500K點的比例),我正在尋找測量1組相似度的最有效方法到另一個。我知道常用的東西:餘弦,Jaccard/Tanimoto等。但是我希望對任何快速/有效的測量相似性的建議,尤其是那些可以通過相似性進行聚類的測量。 編輯1:圖像顯示我需要做什麼。我需要它們的形狀/ orientatoin到羣集中的所有紅色,藍色和綠色等 alt text http://img4