我試圖找到一種方法來存儲我的數據以快速訪問(比O(n)好)。如何使用近似的查詢存儲數據?
我的數據庫由數據(4096字節字符串)組成,它代表一些項目的一些信息。
問題是,查詢從不確切。我得到一個項目,然後需要使用函數F(a,b)
找到最接近的匹配項。
只是一個例子:
1234
3456
6466
F(a,b) = return % of similar digits
GetClosest(1233,F) = 1234
的問題是,F(A,B)是一個複雜的算法,(不是正確的度量)。
我現在只是瀏覽整個數據庫來搜索最佳匹配。
是否有一種樹型或其他類型的數據庫可以讓我更快地發現複雜性?
更多信息:
F給出回來%百分比的相似度值。 100%是完美的搭配。
是否可以在實際檢索過程之前重新排列/存儲數據和索引? – NirmalGeo 2011-05-10 13:15:47
你究竟是什麼意思? – 2011-05-10 13:28:31