這裏定義的二進制字符串是固定大小的「數組」位。我稱它們爲字符串,因爲它們沒有順序(排序/索引它們,因爲數字沒有意義),每一位都獨立於其他位。每個這樣的字符串都是N位長,其中N爲數百。在數據庫中存儲和索引二進制字符串
我需要存儲這些字符串,並使用海明距離作爲距離度量給出一個新的最近鄰居的二進制字符串查詢。
針對基於度量的搜索(VP-trees,cover-trees,M-trees)有專門的數據結構(metric-trees),但我需要使用常規數據庫(在我的情況下是MongoDB)。
是否有一些索引函數可以應用於二進制字符串,在執行一對一漢明距離匹配之前可以幫助數據庫訪問記錄的一個子集? 或者,如何在標準數據庫上實現這種基於漢明的搜索?
「我稱它們爲字符串是因爲它們沒有順序」 - 字符串有順序 - 特別是詞典。 –
當然,通常位序列被稱爲「數字」,或整數是確切的,它們確實具有自然順序。 –