1

我對機器學習或集羣還沒有太多的經驗,所以我在處理這個問題方面有點不知所措。我感興趣的數據由4列組成,其中一列只是一個ID。其他3個包含數字數據,值> = 0。我需要的聚類實際上非常簡單,我可以手動完成,但是稍後它會變得不太清晰,所以我想從正確的過程開始。我需要6簇,這取決於3列(稱它們爲A,B和C)如下:使用RapidMiner設計集羣過程

A B C  Cluster 
---- ---- -------- ------- 
0 0 0  0 
0 0 >0  1 
0 >0 <=B  2 
0 >0 >B  3 
>0 any <=(A+B) 4 
>0 any >(A+B) 5 

在這個階段,這些集羣將給出洞察到數據以通知進一步的分析。

因爲我對此很陌生,所以我還沒有充分了解各種聚類算法,所以我不知道從哪裏開始。任何人都可以提出一個合適的模型,或者我可以研究的一些模型。

回答

2

這是的不是看起來像集羣給我。

相反,我想你想要一個簡單的決策樹分類

它應該已經在Rapidminer中可用。

+0

感謝您的建議。我已經使用規則歸納法工作,但是我看了一下決策樹和它絕對需要的東西! – aquavitae

0

您可以使用「生成屬性」運算符。

這創建了現有的新屬性。

這將是比較煩人創建的所有規則,但他們會像

集羣:如果(((A == 0)& &(B == 0)& &(C == 0 )),1,0)

+0

這就是我開始的地方,但規則將變得比我給出的例子更加複雜,而且他們已經很煩人的做手動。 – aquavitae