nearest-neighbor

    3熱度

    1回答

    我有兩組座標: {(x1,y1),..(xn,yn)} {(w1,z1),..(wn,zn)} ,我想在第2組的每對匹配於所述一對在它最接近的組1中。我的團隊很大,因此搜索需要高效。 任何建議設置這將不勝感激。此外,如果我有兩組第一組= {(x1,y1,z1),..(xn,yn,zn)}和第二組= {(u1,v1, w1),..(un,vn,wn)},我的答案會有什麼不同?此外,考慮到我的團隊太大

    1熱度

    1回答

    我正在研究一個算法,該算法需要從某個給定查詢點的第k個最近點重複(歐幾里得)距離,所有查詢點都取自一個點向量。另外,我反覆需要找到某個點的給定半徑內的所有點。 我正在考慮使用nanoflann庫中的k-d樹。但是,knnSearch()函數返回所有k個最近的鄰居,我不需要。 (雖然radiusSearch()函數很適合我)。 有沒有更有效的方式來獲得我需要的東西,除了每次都通過所有k個最近的鄰居?

    2熱度

    1回答

    我使用隨機超平面讀取了有關最近鄰居搜索的幾個解決方案,但我仍然對這個桶如何工作感到困惑。我有100百萬個文件,形式爲100維向量和100萬個查詢。對於每個查詢,我需要根據餘弦相似性找到最近的鄰居。蠻力的方法是找到cosine查詢的全部1億個文檔的值,並選擇值接近1的那些。我正在努力使用隨機超平面的概念,在那裏我可以把文檔放在桶中,這樣我就不會必須爲每個查詢計算cosine值1億次。

    -2熱度

    2回答

    我有一個Ubuntu 14.04 32位虛擬機,並使用默認的Python 2.7。我有一個近鄰腳本如下: import numpy as np from sklearn.neighbors import NearestNeighbors X = np.array([[28273, 20866, 29961, 27190, 31790, 19714, 8643, 14482, 5384],

    -3熱度

    1回答

    我有一個3維的.txt文件。 X,Y,時間。我的文件看起來像這樣:「10 10 12:00」,下面有更多的點和時間。我發現了只有X,Y值的最近點,但現在我需要幫助找到最近的鄰居與時間有關。 例如,「什麼是最接近點爲‘10 10’我在文件中的點是什麼?‘11 11’,這是最近點 現在有時間補充說: 什麼是「10 10 12:00」的最接近點:是「11 11 22:00」還是「15 15 12:05」

    1熱度

    1回答

    我在找上我應該採取與R. 映射一些點的方法的一些指導今年早些時候,我去了一個森林映射空間分配一些幼苗。我創建了一個網格 - 我每隔兩米就用一個標記名設置一個標記,而我所做的是測量標記到幼苗的距離以及使用軍事指南針的角度。我選擇了這種方法,希望獲得更好的精確度(GPS Garmins在冠層覆蓋下證明這種任務是無用的)。 我對空間分配工作完全陌生,所以我希望有人能夠提供關於我應該使用哪些R軟件包的指導

    6熱度

    1回答

    我正在嘗試查找距離1 KM範圍內的所有最近鄰居。這裏是我的腳本來構建樹和搜索最近點, from pysal.cg.kdtree import KDTree def construct_tree(s): data_geopoints = [tuple(x) for x in s[['longitude','latitude']].to_records(index=False)]

    0熱度

    1回答

    我目前正在嘗試使用R來實現DBSCAN算法以查找我的數據中的離羣值。爲了初始化參數(特別是ε),我必須在我的示例中繪製到第k個鄰居(我選擇k = 3)的遞增排序順序的距離,並查看肘部在哪裏選擇ε的正確值。 正如我所說我使用R統計語言,我發現了兩種不同的函數,計算第k個鄰居nndist()和kNNdist()的距離。如果我默認情況下很好理解,它使用歐幾里德距離。但是在我的數據中,這些函數並不顯示相同

    -1熱度

    1回答

    我有一個約300萬樣本(每個只有3個特徵)的數據集。我使用scikit的sklearn.neighbors模塊 - 特別是radius_neighbor_graph - 來查找哪些樣本屬於特定樣本的小半徑範圍內。 這工作正常,但毫不奇怪,它真的很慢,計算此圖。 這也是非常浪費的,因爲我只需要知道鄰居的一小部分樣本(約10萬) - 我事先知道這個子集。 那麼......有沒有什麼方法可以通過計算給定

    0熱度

    2回答

    我有一個n維向量,並且我想使用euclidian距離在n維向量列表中找到它的k個最近鄰居。 我寫了下面的代碼(k = 10),它運行得很慢,但我想知道是否有更優化的解決方案。 def nearest_neighbors(value, array, nbr_neighbors=1): return np.argsort(np.array([np.linalg.norm(value-x) f