dbscan

    5熱度

    3回答

    需要尋找基於開放/自由密度的聚類庫的幫助,該庫以距離矩陣作爲輸入,並返回其中包含每個元素的聚類,距離每個元素的距離最大爲「x」簇中的其他元素(基本上返回指定密度的簇)。 我檢查了DBSCAN算法,它似乎適合我的需要。 DBSCAN的任何干淨的實現,你可能沒有關閉,它可以預先計算距離矩陣,並輸出具有所需密度的簇? 您的輸入將非常有用。

    4熱度

    3回答

    我們將非常感謝您的意見,建議或解決方案,謝謝。 我在R中使用fpc軟件包對一些非常密集的數據進行dbscan分析(範圍-3,6之間的3組40,000個點)。 我發現了一些羣集,我只需要繪製重要的羣集。問題是我有一個單獨的羣集(第一個),其中有39,000個點。我需要繪製所有其他集羣,但是這個集羣。 dbscan()創建一個特殊的數據類型來存儲所有這些簇數據。它不像數據框那樣被索引(但也許有一種方法

    3熱度

    2回答

    使用在包裝dbscanfpc我能夠得到的輸出: dbscan Pts=322 MinPts=20 eps=0.005 0 1 seed 0 233 border 87 2 total 87 235 ,但我需要找到聚類中心(與大多數種子簇的意思)。任何人都可以告訴我如何繼續這個?

    0熱度

    1回答

    我已經在python中編寫代碼來實現DBSCAN聚類算法。 我的數據集由14k個用戶組成,每個用戶由10個功能組成。 我無法決定將Min_samples和epsilon的值保留爲什麼值作爲輸入 我應該如何判斷? 相似性度量是歐幾里德距離(因此它變得更加難以決定)任何指針?

    1熱度

    1回答

    我正在尋找一個Java矩陣庫來執行數據分析和執行的聚類算法(如K-裝置或DBSCAN)的數據類型(包括字符串)的混合物中 我發現柯爾特和並行Colt(最好用大型和小型數據集執行),但顯然他們不支持String矩陣。數據集條目應該只有雙矩陣。 有什麼建議嗎? 感謝您提前給予的幫助。

    -4熱度

    1回答

    如何使用DBSCAN算法對相似的網址進行分組。我看過很多數據集,但沒有一個使用url,我想採用類似類型的url並將它們組合在一起。在這裏,我無法知道距離(eps),小點可以是要分組的網址數量。

    -1熱度

    1回答

    可能重複: How to apply DBSCAN algorithm on grouping of similar url 我一直告訴我的最終SEM做一個項目,因爲該項目涉及使用聚類DBSCAN類似的字符串。我想知道這可以使用DBSCAN完成,如果是的話,我該如何實現相同的功能。

    1熱度

    3回答

    我在scikit-learn python模塊中測試我在DBSCAN算法中設置的圖像集。有相似計算的替代方案: # Compute similarities D = distance.squareform(distance.pdist(X)) S = 1 - (D/np.max(D)) 加權測量或類似的東西,我可以嘗試,例子?

    2熱度

    2回答

    您好我一直在嘗試爲Neo4j實現DBSCAN算法,但是我遇到了嚴重的性能瓶頸。我將描述實施,然後尋求幫助。 我離散化了可能的ε值,並將每個節點中每個離散化下的鄰居數目計數,以便能夠檢索一個查詢中的所有核心節點。 START a = node(*) WHERE a.rel<cutoff threshold>! >= {minp} RETURN a 這部分是快,是不是快了部分跟進查詢: STA

    6熱度

    1回答

    我需要根據它們在不同介詞(如agentive,instrumental,time,place等)中的分佈情況,找到自然發生的名詞類。我嘗試過使用k-means聚類,但幫助較少,但效果不佳,我在尋找的類有很多重疊(可能是因爲類的非球形形狀和k-means中的隨機初始化)。 我現在正在使用DBSCAN,但我無法理解此聚類算法中的epsilon值和最小值。我可以使用隨機值還是需要計算它們?任何人都可以幫