我正嘗試使用ELKI進行異常值檢測;我有我的自定義距離矩陣,我試圖將它輸入到ELKI以執行LOF(例如,第一次)。ELKI - 輸入距離矩陣
我嘗試關注http://elki.dbs.ifi.lmu.de/wiki/HowTo/PrecomputedDistances,但這並不是很清楚。我做什麼:
我不希望加載從數據庫中的數據,所以我使用:
-dbc DBIDRangeDatabaseConnection -idgen.count 100
(其中100是對象的數量,我會分析)
我用LOF算法中並調用外部距離文件
-algorithm outlier.LOF -algorithm.distancefunction external.FileBasedDoubleDistanceFunction -distance.matrix testData.ascii -lof.k 3
我的距離文件如下(用於測試目的很簡單)
0 0 0
0 1 1
0 2 0.2
0 3 0.1
1 1 0
1 2 0.9
1 3 0.9
2 2 0
2 3 0.2
3 3 0
4 0 0.23
4 1 0.97
4 2 0.15
4 3 0.07
4 4 0
5 0 0.1
5 1 0.85
5 2 0.02
5 3 0.15
5 4 0.1
5 5 0
6 0 1
6 1 1
6 2 1
6 3 1
等
結果說:「都在一個平凡的集羣」,雖然這不是羣集和有絕對是離羣我的數據。
我做的東西是否正確?或者我錯過了什麼?