2015-04-12 18 views
0

我幾乎是數據挖掘的新手。我彙集了一組數據。爲什麼我需要分類? 例如我的集羣數據是:集羣后爲什麼需要分類數據?

cluster A: 
Age: 25 
average: 12.5 


cluster B: 
age: 24 
average = 14 

,我爲集羣預測「性」的數據:

A --> Male 
B --> Female 

首先我可以得出結論,女性有更大的平均值是多少?如果是這樣,爲什麼我需要使用分類?

+0

我投票結束這個問題作爲題外話題,因爲它是關於統計分析而不是編程。 –

+0

謝謝你,先生...... –

回答

0

聚類後不需要分類。

你的方法對我來說沒有意義,而你的結果很可能是不正確的。

如果要計算平均年齡,請在數據的M/F子集上計算它們。 不要假設您的羣集同意性別這通常不起作用。如果你知道你想要的集羣,不要使用集羣,而是使用你的類。

聚類總是會給您帶來不確定性。只用它來探索數據結構,但永遠不會假設羣集是正確的。哪有這回事。它是幫助您找到查看數據的新方法的工具,但它絕不能取代批判性思維和人員檢查。

+0

謝謝你的回答。但這是一個例子。我有24個屬性。你說我不需要任何分類?但是什麼時候使用? –

+0

不,我說不要使用聚類進行分類/預測。 –

相關問題