我對機器學習或集羣還沒有太多的經驗,所以我在處理這個問題方面有點不知所措。我感興趣的數據由4列組成,其中一列只是一個ID。其他3個包含數字數據,值> = 0。我需要的聚類實際上非常簡單,我可以手動完成,但是稍後它會變得不太清晰,所以我想從正確的過程開始。我需要6簇,這取決於3列(稱它們爲A,B和C)如下:使用RapidMiner設計集羣過程
A B C Cluster
---- ---- -------- -------
0 0 0 0
0 0 >0 1
0 >0 <=B 2
0 >0 >B 3
>0 any <=(A+B) 4
>0 any >(A+B) 5
在這個階段,這些集羣將給出洞察到數據以通知進一步的分析。
因爲我對此很陌生,所以我還沒有充分了解各種聚類算法,所以我不知道從哪裏開始。任何人都可以提出一個合適的模型,或者我可以研究的一些模型。
感謝您的建議。我已經使用規則歸納法工作,但是我看了一下決策樹和它絕對需要的東西! – aquavitae