dbscan

    0熱度

    1回答

    如果我在相似度矩陣上應用Scikit的DBSCAN(http://scikit-learn.org/stable/modules/generated/sklearn.cluster.DBSCAN.html),我會得到一系列標籤。其中一些標籤是-1。文件稱他們爲噪音樣品。 這些是什麼?他們都屬於一個集羣,還是他們都屬於他們自己的集羣,因爲他們很吵? 謝謝

    0熱度

    1回答

    我已經運行DBSCAN模型來聚類地理數據點,即緯度和縱向。要設置參數,我希望有一個視覺輸入,以瞭解羣集在地圖中的外觀。 我該如何做到這一點?此外,在不會崩潰我的電腦的形式。例如,使用gmaps繪製800 K點會顯着減慢我的計算機速度。 謝謝!

    0熱度

    1回答

    我想使用sklearn中的DBSCAN實現。它們允許您使用自定義距離度量標準,但只能使用一個eps值。 我想要的是以下內容: 可以說我的點每個都有3個特徵,所以每個點都可以被認爲是p=np.array([p1,p2,p3])形式的一個numpy數組。如果np.abs(p1-q1) < eps1和np.abs(p2-q2) < eps2和np.abs(p3-q3) < eps3兩點p和q是鄰居。通常

    1熱度

    1回答

    我有一個關於使用點雲的聚集來執行聚類的問題,其中一個維度 - 代表時間 - 有點受到保護。 爲了使超清晰,考慮這個視頻 用肉眼人們可以看到一些濃密雲層飛來飛去像蚊子,它們可能代表幾件事情進入和離開現場。現在假設我們有一個3維點(X,Y,時間)的數組,並應用一些天真的集羣(比如DBSCAN) 現在聚類相當不錯,除了會議事件在考慮相同的羣集,提出了X軌跡。現在,如果有不同的方式來處理第三個座標,也許人

    -1熱度

    1回答

    所以我的任務是從.csv文件讀取數據並形成羣集。我的代碼在一個小的.csv文件上工作正常,但是當我嘗試閱讀原始文件時,我必須處理它(它包含大約24k行)我的計算機掛起和磁盤使用100%拍攝,我有t0重新啓動系統。我處於死衚衕,不知道發生了什麼。 DBSCAN代碼與sklearn網站上提供的演示文件相同。然而讀取我寫的數據的代碼 import csv import numpy as np imp

    -1熱度

    2回答

    我想以此爲榜樣,我自己的一些數據:http://scikit-learn.org/stable/auto_examples/cluster/plot_dbscan.html#sphx-glr-auto-examples-cluster-plot-dbscan-py 我有麻煩搞清楚如何讓我的「labels_true」變量作爲DBSCAN預測評估的一部分。 這裏是首先需要行吧: print("Homo

    0熱度

    1回答

    我正在使用DBSCAN對數據集執行聚類。我認爲這是因爲在plt.plot()中傳遞給markerfacecolor的顏色參數不是單個值。請讓我知道如果我在這裏錯了。我的功能是緯度,經度,speed_mph,speedlimit_mph,vehicle_id,driver_id。 這裏是我的集羣代碼 dbsc = DBSCAN(eps = .5, min_samples = 5).fit(df_co

    1熱度

    1回答

    下面 鑑於數據,我已經在那些點 set.seed(294056) df = data.frame(x = runif(1000), y = runif(1000), z = runif(1000)) library(dbscan) db = dbscan(df, eps = 0.3, minPts =100) # formed 1 cluster print(db) DBSCAN cl

    0熱度

    2回答

    我有一大組診斷代碼序列,我試圖根據相似性進行聚類。我通過使用最小公共子序列算法計算相似性,然後從1中減去該相似性來找出每個序列之間的距離,從而創建了一個距離矩陣。 我然後通過了距離矩陣成sklearn的DBSCAN爲這樣: db = DBSCAN(eps=0.34, metric='precomputed') db.fit(sim_mat) 創建簇後,I輸出中包含的每一個到一個文本文件的序列

    -1熱度

    1回答

    我想用Gowalla的數據集簇位置。[這是我的數據包含用戶ID(INT),檢查時間(多項式),緯度(真),經度(真正),地點(INT) 我有這樣的錯誤。 我的代碼有什麼問題? import csv import numpy as np from scipy.spatial import distance from sklearn.cluster import DBSCAN labels