我想用Apriori來對交易數據進行親和度分析。我有一張帶有訂單和他們信息列表的表格。我主要是需要用OrderID和產品ID屬性,其是在以下格式Weka Apriori算法
訂單ID的ProductID
1的
1乙
圖1C
2甲
2 C
3甲
Weka要求您爲每個產品ID創建一個名義屬性,並使用如下所示的true或false值指定項目是否存在於訂單中:
1,TRUE,TRUE,TRUE
2,TRUE,FALSE,TRUE
3,TRUE,FALSE,FALSE
我的數據集包含約10K記錄... 3K左右不同的產品。任何人都可以建議一種方法來創建這種格式的數據集? (除了手動耗時的方式...)
嗯,我是一個剛剛開始嘗試這些東西的學生,所以它看起來不像是一個「簡單的編程任務」可能還有其他很多其他人,因爲我看起來非常類似的未解答的問題。那謝謝啦。 – user2275504 2013-05-16 09:09:03
是的,這裏有很多題外話題。該網站是編程問題,你顯然還沒有嘗試用自己的簡單代碼解決這個問題。 – 2013-05-16 17:00:08