nearest-neighbor

    2熱度

    3回答

    鑑於1條十億記錄包含下列信息: ID x1 x2 x3 ... x100 1 0.1 0.12 1.3 ... -2.00 2 -1 1.2 2 ... 3 ... 對於每個ID以上,我想找到的前10最接近的ID,基於它們的矢量的歐幾里德距離(X1,X2,...,X100) 。 什麼是計算這個最好的方法?

    2熱度

    1回答

    任何人都可以告訴我我的代碼有什麼問題嗎? 爲什麼我可以使用LinearRegression預測虹膜數據集的概率,但是,KNeighborsClassifier會給我0或1,而它應該給我一個像LinearRegression一樣的結果? from sklearn.datasets import load_iris from sklearn import metrics iris = load_

    1熱度

    1回答

    M矩陣是簽名矩陣,其經由Minhashing產生的實際數據的,具有文檔作爲爲行列和單詞。所以一列代表一份文件。 現在它說每個條紋(b的數量,r的長度)都有其列的散列,以便列落入一個桶中。如果兩列落入同一個桶中,對於> = 1條紋,則它們可能相似。 這意味着我應該創建b散列表並找到b獨立散列函數?或者只有一個就足夠了,每個條帶都將其列發送到相同的存儲桶集合(但是這不會取消條帶)? 在這種情況下,字典

    0熱度

    1回答

    列表不可排除。然而,我是implementing LSH,我是尋求一個散列函數,它將對應於k個桶中正整數([1.29000])的列表。列表的數量是D,其中D> k(我認爲)和D = 40.000,其中k還不知道(對建議開放)。 實施例(d = 4,K = 2): 118 | 27 | 1002 | 225 128 | 85 | 2000 | 8700 512 | 88 | 2500 | 100

    0熱度

    1回答

    我有列表Id,緯度(DOUBLE),經度(DOUBLE),價格(DOUBLE)約40​​K條目的MySQL表。現在我想計算每一行中某個社區(例如5公里範圍內)有多少條目,以及該社區的平均價格是多少。 所以結果應該是形式: Id | COUNT | AVG(price) --------------------- 1 | 5 | 5.9 --------------------- 2 |

    2熱度

    1回答

    我想知道是否有強制sklearn NearestNeighbors算法的方法,以便在存在重複點時考慮輸入數組中某個點的順序。 爲了說明: >>> from sklearn.neighbors import NearestNeighbors >>> import numpy as np X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2

    2熱度

    2回答

    考慮2D,3D,(4D ...)空間中的點陣列(例如,unstructured mesh的節點)。最初,數組中一個點的索引與其在空間中的位置無關。在簡單的情況下,假設我已經知道一些最近鄰居連通性圖。 我想要一些啓發式方法來提高在空間中彼此靠近的兩個點具有相似指數(在陣列中接近)的概率。 我知道確切的解決方案非常困難(可能類似於Travelling salesman problem),但我不需要確切

    2熱度

    1回答

    我讀過original paper關於局部敏感散列。 複雜性是參數ε的函數,但我不明白它是什麼。 請問您能解釋它的含義嗎?

    2熱度

    1回答

    我想了解關於LSH的this paper的第5部分,特別是如何對生成的哈希進行處理。引用鏈接的紙:由d比特的每個 鑑於位向量,我們選擇N = 0(N 1 /(1 +小量) )比特的隨機置換。對於每個隨機置換σ,我們 保持位向量的排序次序Oσ,按照由σ置換的位的字典順序 。給定一個查詢位向量q,我們通過執行以下操作找到近似最近鄰居:對於每個permu- ,我們對Oσ執行二分搜索以找到最靠近q的兩個位

    -1熱度

    1回答

    作爲我爲期一年的軟件開發課程的最終項目的一部分,我需要實施knn項目,預測android應用程序中足球比賽的結果。 我建立預測上的在線託管網站的mysql數據庫(php空間):在每場比賽 DIFF平均進球平均分每場比賽 DIFF在每場比賽 結果 我的導師推薦ķ應該承認平均目標 差異等於100,並構建一個重要的數據集(超過1000個結果) 從這裏我失去了我應該如何處理手頭的問題。任何人都可以進一步指