自動學習集羣

HI完整的新手問題在這裏：我有一個由兩列組成的表。第一列屬於由果實蒼蠅居住的地方編碼的「箱」。第二列分別是0或1，中性vs真的很像糖。我有兩個問題？ 1）如果我懷疑有一個變量，那麼他們住在哪裏就是確定他們是否喜歡糖。有沒有辦法讓我的電腦可以分成兩組？所有的箱子都喜歡糖和中性。這樣我們可以做進一步的實驗來確定垃圾箱是什麼。自動學習集羣

2）自動確定有多少集羣可能會導致此行爲？例如，可能有4個變量（4個集羣）可以確定糖偏好的結果。

道歉，如果這是微不足道的。下表列出了該表。謝謝！

來源

2014-02-22 Ahdee

1）問題不明確，如果您問是否可以分類，給定一個垃圾箱，喜歡加糖或不加糖的蒼蠅，答案是肯定的。 2）再次不清楚，你想找到基於「喜歡糖」列的垃圾箱羣？然後答案是肯定的。您能否更清楚地回答您的問題？ – mp85

@ mp85對不起的措辭抱歉。所以對於1）我想要的是有兩個集羣;每個代表中性或類似的糖。在每個集羣中應該有一個分箱列表。如果我假設代碼將所有表示爲中性的單元格代碼設置爲1，並將所有糖類的糖類代碼設置爲零，那麼當我進行迴歸時，它應該給我最強的可能性預測。第二，如果計算機可以告訴我哪些是最佳羣集，並且在這些羣組中屬於哪個羣組，那將會很好。當我做同樣的迴歸時，應該給予最強烈的關係。 – Ahdee

不要把聚類分析看作是「學習」一些變量。然後你在做分類，而不是結構發現。對於聚類分析，請考慮定義*結構*。 –

好的，假設我理解你的意思，應該使用貝葉斯過濾來解決問題1）的一種方法。說事件L是「蒼蠅喜歡糖」，事件B是「蒼蠅在B倉」。

所以，你所擁有的是：

number of flies = 84  
size of each bins = (eg size of bin 1: 4)

概率蒼蠅喜歡糖：

P(L) = flies that like sugar/total number of flies = 43/84

概率一隻蒼蠅不喜歡糖：

P(notL) = 1 - P(L) = 41/84

概率一隻蒼蠅在給定的倉內：

P(B) = size of the bin/sum of the sizes of all bins = 4/84 (for bin 1)

概率一隻蒼蠅是不是在給定斌：

P(notB) = 1 - P(B) = 80/84 (for bin 1)

概率蒼蠅喜歡糖，知道這是在倉B：

P(L|B) = flies that like sugar in a bin/size of the bin 
(eg for bin 1 is 2/4 = 1/2)

概率蒼蠅喜歡糖，知道它不在箱B中：

P(L|notB) = (total flies that like sugar - flies that like sugar in the bin)/(size of bins - size of the bin)) = 41/80

你想知道蒼蠅在鑑於容器b明知喜歡糖，你可以得到：

P(B|L) = (P(L|B) * P(B))/(P(L|B) * P(B) + P(L|notB) * P(notB))

如果計算P（B | L）和P（B | NotI位），每個箱，那麼你就知道該箱具有含有像糖一樣的蒼蠅的可能性最高。然後你可以進一步研究這些垃圾箱。

希望我很清楚，我的統計數據有點生疏，我甚至不確定我是否正確地做了一切。把它作爲暗示，指出你正確的方向來解決這個問題。

您可以參考here以獲得更準確的推理和結果。

至於問題2）...我必須多想一些。

來源

2014-02-22 12:14:41 mp85

謝謝，這是聰明的利用 - 我認爲這對我很好。 – Ahdee

自動學習集羣

回答

相關問題