我想選擇合適的數據集來做fpGrowth和提取關聯規則。我知道關係數據集和事務數據集適合於這個任務,但我想知道一般什麼樣的數據集適合這項任務?Fp-Growth和關聯規則的適當數據
0
A
回答
0
正如您所提到的,用於執行關聯規則挖掘的正確數據集是關係數據集。有時數據集對於我們的目的來說是格式良好的,但在大多數情況下,它不是,在這種情況下,應該將屬性更改爲二進制類型,以便每個單元格都可以爲false或true。請記住,如果您的屬性類型是數字,則應該進行離散化。
0
您需要條目集。不允許重複,不需要訂單。
E.g. butter, milk, bread
- 牛奶多少並不重要。
此外,建議合計產品類別而不是單個項目,即任何種類的奶都被認爲是相同的。
相關問題
- 1. Pyspark - fpgrowth - 關聯規則 - StackOverflow錯誤
- 2. 關聯規則
- 3. 關聯規則數據格式
- 4. 使用數據中的Arules和ArulesViz的關聯規則
- 5. Apriori和Hadoop的關聯規則
- 6. 的CakePHP HABTM關聯規則
- 7. 關係數據庫上的關聯規則挖掘
- 8. 如何提取關係數據中的關聯規則
- 9. 關聯規則的數組PHP
- 10. 數據幀上的FPGrowth?
- 11. 關聯規則與車
- 12. 關聯規則算法
- 13. 鋼軌關聯規則
- 14. 反向關聯規則
- 15. 關聯規則錯誤
- 16. 查找關聯規則
- 17. pyspark FPGrowth不適用於RDD
- 18. 從R中輸出的關聯規則創建數據框
- 19. 獲取用於與Weka建立關聯規則的數據集
- 20. 與熊貓的關聯規則數據幀
- 21. 用於Pandas Python數據框關聯規則的Transacction ID列。
- 22. 橙色數據挖掘版本3.3(Python)的關聯規則
- 23. 如何JSON數據轉換成適當的關聯數組
- 24. 關聯規則算法中的平凡規則
- 25. python讀取數據建立關聯規則
- 26. 核心數據關係刪除規則 - 廢止+級聯
- 27. 文本文件的關聯規則
- 28. 置信度計算的關聯規則
- 29. 關聯規則中的錯誤
- 30. R帶回路的關聯規則