我有一個市場交易數據集,包括時間戳和貨物如下。神經網絡可以用來預測一定的時間戳集
約翰總是在超級市場買牛奶和麪包。除此之外,他還買了一些如下的商品:
- 週一,約翰買了牛奶,麪包{啤酒,巧克力}。
- 週二,約翰買了牛奶,麪包{馬鈴薯}。
- 週三,約翰買了牛奶,麪包{巧克力,鱷梨,花生}。
我們可以回答這個問題:「他會在週四買什麼?」。
例如:他會在週四購買除了牛奶和麪包之外的{啤酒,鱷梨}。
我認爲這是一種多元迴歸。在這種情況下,我可以使用哪種模型來預測一組商品?
我有一個市場交易數據集,包括時間戳和貨物如下。神經網絡可以用來預測一定的時間戳集
約翰總是在超級市場買牛奶和麪包。除此之外,他還買了一些如下的商品:
我們可以回答這個問題:「他會在週四買什麼?」。
例如:他會在週四購買除了牛奶和麪包之外的{啤酒,鱷梨}。
我認爲這是一種多元迴歸。在這種情況下,我可以使用哪種模型來預測一組商品?
如果我正確理解你的問題比它是一個多標籤分類。
你有一些輸入功能(dayofweek,HasBoughtMilk HasBoughtBread等)。並且你想根據它們預測其他幾個標籤(啤酒,鱷梨)。你可以輕鬆地使用sklearn來做到這一點,它支持多標籤分類。
如果你要考慮什麼是對前幾天買了(因爲它會影響您的標籤),你可以在兩個方面做到這一點:
1)添加合成的功能,如該節目「這個星期HasBoughtBread已經」二進制 2)或者使用擅長處理時間序列的RNN。
您正在公開的問題似乎是隨機森林的教科書案例。您試圖表達的推理規則在決策樹中非常適合。隨機森林將爲您提供靈活的模型,並且可以快速訓練。
當然,這不是唯一的方法,你可以使用支持向量機或像RNNs一樣的深度學習,但它感覺像使用火箭筒爲我打了一隻蒼蠅。
乾杯,
昆汀
這取決於你試圖模擬實際的因素。有些項目是相互依賴的嗎?數據中是否有實際的時間元素,還是我們只是有條件地推斷它?
假設你有一個時間元素,你一定會想要一些時間序列分析的順序,一個購買的順序,或許有實際的時間滯後。例如,如果約翰某天沒有去商店,他的購買會發生什麼?我們是否需要了解一些東西被多少次購買?一項產品購買是否會加速或延遲另一項?
這些考慮建議對數據進行預處理(對於時間滯後)或某種RNN,LSTM或Q-net延遲。樸素貝葉斯或隨機森林可能會有所幫助,但您仍然需要先預處理時間關係。
我認爲:時間序列分析可以回答這個問題:「約翰何時會去超市?」。我的問題是找到貨物和時間的關係。我們可以通過給定時間戳來推斷一組貨物嗎? –
時間系列也很好預測「約翰下一次需要購買咖啡的時間?」然後您可以每天選擇以獲取預測的購物清單。 – Prune
數據集中有很多商品。我們不能在數據集中標記每個商品。此外,我們無法確定我們的標籤是否完美。如何將無監督學習和時間序列相結合? –