2015-05-10 80 views
0

我發現以下問題:什麼類型的機器學習技術在這種情況下使用?

enter image description here

我已經做了以下預假設,我想,如果有人能幫助我,看看他們是對還是錯:

  • 我相信有必要對數據進行預處理,因爲價格和數量可以在不同的範圍內,例如每千美元售出的每種糖果的價格以及噸數或其他公制單位的數量。

  • 乍一看,我可以看到有可能使用神經網絡技術,多層nn可能帶有反向傳播算法。投入可以是從我們售出的價格,我們出售的每種糖果的數量和競爭對手出售的價格十年中獲得的數據;每個輸出的三個神經元代表每種類型的糖果要銷售的數量。

  • 我不確定我是否可以使用線性迴歸技術,因爲可能數據不具有線性特徵,某些功能會使我的預測模型無效。

  • 邏輯迴歸可以使用,我建議可以使用一個vs全部的模型來處理這種情況,因爲我們將有三個輸出,每種類型的糖果都有一個輸出。投入可以是競爭者每種類型糖果的銷售價格,我們銷售的數量以及我們銷售的價格(全部爲十年)。

除了注意:我還可以用作爲輸入那是在市場在過去2年糖果的數量,但在這裏我將不得不重新調整它,因爲我用的是10年的時間段。

  • 集羣?我不知道如何在這裏使用它。

任何幫助?

回答

1

似乎是一個多項選擇問題(「以下哪種算法...?」),但您不明確告訴我們這些替代方案是什麼。

真的不能沒有更多的信息,但這裏有一些想法。

他們要求數值結果=>這是一個迴歸問題。

他們沒有要求概率或相對優勢:>不是一個邏輯迴歸問題(無論如何都用於分類/分類響應變量)。儘管有一些假設+數據處理,你可以把它看作一個迴歸問題,我想。

線性迴歸在這裏看起來不錯,儘管一些屬性(caketype)是名義/分類的。大多數統計軟件包的線性模型函數可以處理這個問題。

適合= LM(Q〜價+ price_of_competitors +一年| caketype)

無羣集。沒有神經網絡。

也許NN可以使用,但它更像是一個黑盒子(應用logit函數)給我。它似乎不適合這項工作,因爲這是價格p和數量之間的簡單線性關係的問題。

+0

謝謝@knb,但我有一個疑問;爲什麼在這種情況下不能使用神經網絡? – Little

+0

@小小更新了我的答案。 – knb

相關問題