在DBSCAN中,如果我們有minPoints = 3,並且我們想要確定一個點是否是核心點,那麼您是否在Eps中計算該點本身,還是需要其他3個點點在它的Eps?Eps中的哪些點數DBSCAN
回答
根據維基百科中提供的算法,點P
的區域查詢返回P's
eps
鄰域內的所有點,包括P
。
這裏的算法(從Wikipedia)
DBSCAN(D, eps, MinPts)
C = 0
for each unvisited point P in dataset D
mark P as visited
NeighborPts = regionQuery(P, eps)
if sizeof(NeighborPts) < MinPts
mark P as NOISE
else
C = next cluster
expandCluster(P, NeighborPts, C, eps, MinPts)
expandCluster(P, NeighborPts, C, eps, MinPts)
add P to cluster C
for each point P' in NeighborPts
if P' is not visited
mark P' as visited
NeighborPts' = regionQuery(P', eps)
if sizeof(NeighborPts') >= MinPts
NeighborPts = NeighborPts joined with NeighborPts'
if P' is not yet member of any cluster
add P' to cluster C
regionQuery(P, eps)
return all points within P's eps-neighborhood (including P)
由於核心點被定義爲一個具有更多的積分是MinPts
與Eps
,我會說點本身算作同時確定它是否是一個核心點或不。
DBSCAN是一種具有數據庫上下文的算法。
爲了獲得良好的性能,您需要一個可以使用索引加速查詢的數據庫 - 這將運行時從O(n^2)
減少到O(n log n)
。
如果發送範圍查詢到數據庫,它將返回所有的這個區域內的物體,包括的查詢點。您將不得不從結果中手動刪除查詢點。
但是從邏輯的角度來看:這是一個密度測量。爲什麼密度估計必須排除查詢對象?它是數據集的一部分,它應該像任何其他對象一樣貢獻密度!
我看不到任何理由爲什麼應該從每個查詢的數據集中刪除查詢點。
我想你錯過了我的問題,或者把它和其他一些問題混淆了。 :) – user3628045
不,我沒有。 「點本身」在數據庫上下文中通常被稱爲「查詢點」。因爲你查詢數據庫的這一點的鄰居。 –
你絕對是對的,我看你的帖子有點快。很抱歉,感謝您的重播! – user3628045
- 1. DBSCAN的參數eps,python
- 2. sklearn中的多個eps值DBSCAN
- 3. Scikit DBSCAN eps和min_sample值的確定
- 4. DBSCAN中的參數估計
- 5. hadoop中的DBSCAN
- 6. 在DBSCAN中,如何確定邊界點?
- 7. 查看哪些站點使用IIS 7中的哪些IP
- 8. 分析EPS元數據 - 區分手繪EPS和Illustrator EPS
- 9. 這些不同的函數定義有哪些優缺點?
- 10. 控制哪些線有點?
- 11. MIPS中的浮點寄存器是哪些數字寄存器?
- 12. DevExpress Reports有哪些優點/缺點?
- 13. 使用SQLDataReader有哪些優點/缺點?
- 14. ELKI dbscan示例
- 15. DBSCAN從情節
- 16. Matlab中的小eps數字大小
- 17. 設置數據庫以跟蹤哪些用戶點擊了哪些鏈接?
- 18. C#中的類型推斷有哪些優點和缺點?
- 19. API方法中Google端點支持哪些參數類型?
- 20. 在Excel-DNA中標記函數IsMacroType有哪些優缺點?
- 21. 在鏈表中,析構函數刪除了哪些節點?
- 22. Matlab的:EPS
- 23. Xcode中的UIImage EPS格式
- 24. 什麼是THREE.OrbitControl中的EPS?
- 25. Python中的DBSCAN:意外的結果
- 26. python中的DBSCAN - 內存不足
- 27. 使用R獲取DBSCAN中的噪音
- 28. DBSCAN中變化的羣集標籤
- 29. 在Python的地圖中可視化DBSCAN
- 30. DBSCAN中的替代相似性度量?
看起來合法,謝謝先生! – user3628045