2016-04-11 75 views

回答

0

正如您所提到的,用於執行關聯規則挖掘的正確數據集是關係數據集。有時數據集對於我們的目的來說是格式良好的,但在大多數情況下,它不是,在這種情況下,應該將屬性更改爲二進制類型,以便每個單元格都可以爲false或true。請記住,如果您的屬性類型是數字,則應該進行離散化。

0

您需要條目集。不允許重複,不需要訂單。

E.g. butter, milk, bread - 牛奶多少並不重要。

此外,建議合計產品類別而不是單個項目,即任何種類的奶都被認爲是相同的。