HI完整的新手問題在這裏:我有一個由兩列組成的表。第一列屬於由果實蒼蠅居住的地方編碼的「箱」。第二列分別是0或1,中性vs真的很像糖。我有兩個問題? 1)如果我懷疑有一個變量,那麼他們住在哪裏就是確定他們是否喜歡糖。有沒有辦法讓我的電腦可以分成兩組?所有的箱子都喜歡糖和中性。這樣我們可以做進一步的實驗來確定垃圾箱是什麼。自動學習集羣
2)自動確定有多少集羣可能會導致此行爲?例如,可能有4個變量(4個集羣)可以確定糖偏好的結果。
道歉,如果這是微不足道的。下表列出了該表。謝謝!
Bin sugar
1 1
1 1
1 0
1 0
2 1
2 0
2 0
3 1
3 0
3 1
3 1
4 1
4 1
4 1
5 1
5 0
5 1
6 0
6 0
6 0
7 0
7 1
7 1
8 1
8 0
8 1
9 1
9 0
9 0
9 0
10 0
10 0
10 0
11 1
11 1
11 1
12 0
12 0
12 0
12 0
13 0
13 0
13 1
13 0
13 0
14 0
14 0
14 0
14 0
15 1
15 0
15 0
16 1
16 1
17 1
17 1
18 0
18 1
18 1
17 1
19 1
20 1
20 0
20 0
20 1
21 0
21 0
21 1
21 0
22 1
22 0
22 1
22 1
23 1
23 1
24 1
24 0
25 0
25 1
25 0
26 1
26 1
27 1
27 1
1)問題不明確,如果您問是否可以分類,給定一個垃圾箱,喜歡加糖或不加糖的蒼蠅,答案是肯定的。 2)再次不清楚,你想找到基於「喜歡糖」列的垃圾箱羣?然後答案是肯定的。 您能否更清楚地回答您的問題? – mp85
@ mp85對不起的措辭抱歉。所以對於1)我想要的是有兩個集羣;每個代表中性或類似的糖。在每個集羣中應該有一個分箱列表。如果我假設代碼將所有表示爲中性的單元格代碼設置爲1,並將所有糖類的糖類代碼設置爲零,那麼當我進行迴歸時,它應該給我最強的可能性預測。第二,如果計算機可以告訴我哪些是最佳羣集,並且在這些羣組中屬於哪個羣組,那將會很好。當我做同樣的迴歸時,應該給予最強烈的關係。 – Ahdee
不要把聚類分析看作是「學習」一些變量。然後你在做分類,而不是結構發現。對於聚類分析,請考慮定義*結構*。 –