2015-11-13 65 views
3

這可能是一個R第的混合和算法問題。問題是關於兩個OPTICS在一般和封裝將R執行光學的「DBSCAN」(https://cran.r-project.org/web/packages/dbscan/dbscan.pdf如何提取使用OPTICS簇(R包 - DBSCAN,或替代)

我的主要原因,從使用DBSCAN到光學器件移動是,數據集I有具有可變密度的簇,並且它們形狀不規則。 OPTICS產生可達性圖,但對於我的用例來說,更有趣的部分是提取集羣。原始論文中描述的一些自動聚類提取不僅僅是EPS的一個切點。 (http://fogo.dbs.ifi.lmu.de/Publikationen/Papers/OPTICS.pdf)。

所以我的兩個部分QN: 1)是否有使用R包以這種方式爲自動提取的方法嗎? 2)是否有支持這個(python,在別處)的OPTICS實現?

+2

ELKI具有自動提取廣泛描述,並且最靈活OPTICS實施見https://cran.r-project.org/web/packages/dbscan/vignettes/dbscan.pdf。特別是,它適用於地理數據和自定義距離功能。 –

+0

感謝Anony-Mousse。我會嘗試ELKI出和/或寫入R. – ednaMode

+0

ELKI工作great..though它確實會證明OPTICSXi不能真正處理我的數據集所有的好我自己的集羣提取碼。我懷疑的是,它有一些東西需要用事實證明我的集羣是不對稱的,他們開始了對我的2D繪圖的一側密集,成爲稀疏,當您移動到另一個。此外,集羣結構顯示了很多很多的小島,每個島都有不同的密度和間距。無論如何,ELKI幫助我確定OPTICS只能做這麼多事情。感謝您的指導! – ednaMode

回答

0

1)是的! dbscan軟件包具有提取密度可變的光學組件的功能。 ?dbscan::extractXi()

提取物根據可達性圖的陡度,Ankerst等人(1999)在xiearchically指定的Xi提取物集羣。 xi參數的一種解釋是它通過相對簇密度的改變來對簇進行分類。使用的算法最初由ELKI框架貢獻,但包含一組修正。

爲方法和實例