我幾乎是數據挖掘的新手。我彙集了一組數據。爲什麼我需要分類? 例如我的集羣數據是:集羣后爲什麼需要分類數據?
cluster A:
Age: 25
average: 12.5
cluster B:
age: 24
average = 14
,我爲集羣預測「性」的數據:
A --> Male
B --> Female
首先我可以得出結論,女性有更大的平均值是多少?如果是這樣,爲什麼我需要使用分類?
我幾乎是數據挖掘的新手。我彙集了一組數據。爲什麼我需要分類? 例如我的集羣數據是:集羣后爲什麼需要分類數據?
cluster A:
Age: 25
average: 12.5
cluster B:
age: 24
average = 14
,我爲集羣預測「性」的數據:
A --> Male
B --> Female
首先我可以得出結論,女性有更大的平均值是多少?如果是這樣,爲什麼我需要使用分類?
聚類後不需要分類。
你的方法對我來說沒有意義,而你的結果很可能是不正確的。
如果要計算平均年齡,請在數據的M/F子集上計算它們。 不要假設您的羣集同意性別這通常不起作用。如果你知道你想要的集羣,不要使用集羣,而是使用你的類。
聚類總是會給您帶來不確定性。只用它來探索數據結構,但永遠不會假設羣集是正確的。哪有這回事。它是幫助您找到查看數據的新方法的工具,但它絕不能取代批判性思維和人員檢查。
謝謝你的回答。但這是一個例子。我有24個屬性。你說我不需要任何分類?但是什麼時候使用? –
不,我說不要使用聚類進行分類/預測。 –
我投票結束這個問題作爲題外話題,因爲它是關於統計分析而不是編程。 –
謝謝你,先生...... –