我在R工作組,有一個數據集,它看起來像下面刪除空值行時評估怡亨和先驗項集
[1, 2, 3, ""]
[1, 2, "", 4]
[1,"", "", ""]
我讀這些值轉換爲交易對象,然後將它們傳遞到怡亨或先驗頻繁項目評估。當我的頻繁項集看起來像下面的問題出現了:
{1,""}
{2,3,""}
我想,因爲我認爲它減慢處理,也不會使從預測的角度來看任何意義,從計算中刪除這些行。你能幫忙嗎?我的R代碼如下。
tr <- read.transactions("Items.csv", rm.duplicates=TRUE, format="basket",sep=",")
dataset1 <- as.vector(t(dataset1))
frequentItems <- eclat (tr, parameter = list(supp = 0.03, minlen=2, maxlen = 4))
inspect(frequentItems)
謝謝, 馬特
數據集的結構看起來很令R人感到困惑。你可以給我們提供一些我們可以自己嘗試的代碼,也許可以添加你的函數來的包(這是'arules'包,對不對?) –