好吧,所以我搜索了很多並且想要在銷售數據上運行arules。我只需要以正確的格式正確獲取數據,並使用正確的「因素」或「變量」和籃子形式進行設置。如何將交易數據準備到arules的購物籃
現在我有銷售數據與訂單#然後裏面的項目。每個訂單都是唯一的(每個新訂單,一個新的#會被創建幷包含零件編號),但是相同的項目顯然可以以多個訂單出現。
目前,我的數據設置是這樣的:
Order# Part# PartDescription
1 A PartA 1 B PartB 1 G PartG 2 R PartR 3 A PartA 3 B PartB 4 E PartE 5 Y PartY 6 A PartA 6 B PartB 6 F PartF 6 V PartV
所以,R不喜歡這種形式,我必須得到它的形式arules和數據分析將接受。
是的,我將其保存爲文本文件,並嘗試.csv文件,但如果我可以如何來準備,或操縱它在RStudio一步的指示得到一步那簡直太好了。
我讀,它的假設是在一個筐的形式,例如..
1(A,B,G)
2(R)
3(A,B)
4(E )
5(Y)
6(A,B,F,V)
如果這是不準確的請指正。我明白了,但我只需要一步一步的指導,我似乎無法找到任何地方。我試過使用dplyr和tidyr。我對數據分析有很好的理解,但需要RStudio的更直接的幫助,所以如果我可以一步步地做到這一點,我會進一步理解這一點。
我也有Excel中的數據挖掘插件,所以如果我能做到在那裏的任何準備讓我知道。謝謝。 – V1k1
我假設你至少有數據加載到r作爲data.frame?如果沒有,嘗試'數據< - read.csv(「myfile.csv」,comment.char =「」)' – jeremycg
我只需點擊「導入數據集」,到目前爲止的迴應是將我的數據放入正確的籃子格式。我是否需要將它作爲data.frame加載到r中以避免更多問題?我應該用什麼方法將它加載到r中?這是來自Excel的文本文件,它應該是.csv嗎?我的父親出現在正確的列/行中。我應該選擇哪些導入設置?謝謝! – V1k1