arules

    0熱度

    1回答

    我正試圖找到一種快速方法對具有數百萬行數的交易型市場購物籃數據進行親和性分析。 什麼我迄今所做的: 創建 獲取與RevoScaleR 開始對雲星火& Hadoop之上的R服務器(Azure的HDInsight)在HDFS 加載數據 但是,我陷入了最後一步。據我所知,我將無法使用RevoScaleR中未提供的函數來處理數據。 下面是用於訪問HDFS數據的代碼: bigDataDirRoot <- "

    1熱度

    1回答

    我正嘗試使用以下代碼來使用「arules」包關聯規則。 數據鏈路(http://archive.ics.uci.edu/ml/datasets/Adult) library(Matrix) library(arules) adult<-read.table("adult.data.txt", sep = ",") colnames(adult)<- c("age","workclass","

    0熱度

    1回答

    我試圖做使用arules包一些市場購物籃分析,但是當我使用summary()功能的itemMatrix對象來檢查哪些是最常見的物品,這些數字做不加起來。 如果我做的: library(arules) x <- read.transactions("Supermarket2014-15.csv") summary(x) 我得到: transactions as itemMatrix in s

    1熱度

    1回答

    我是R的初學者,但是,我想了解更多。我正在嘗試進行市場分析。 這是我的原始數據,我想將其轉換爲一個交易籃格式: 這就是我想實現: 我有嘗試過: trans <- as(split(a[,"Game.played"],a[,"sessionid"]),"transactions") 但是,而不是遊戲的名稱,只顯示遊戲的數量。誰能告訴我爲什麼會發生這種情況?另外,我已經交叉驗證了實際數據,並且se

    0熱度

    1回答

    我是R的初學者,我非常感謝所有幫助。我有一些數據,我清理了一些數據,刪除了重複數據等。現在,我有一個CSV文件中的這些數據,我的主要問題是我無法將其轉換爲事務。我只能將它們轉換成列表,但不能作爲交易。 Please let me know how I can change this data to This data (like as transactions) 請幫幫忙,TIA!

    3熱度

    2回答

    長時間的答案搜索者,第一次提問者。我有一個R數據幀是單個列,267000行與17個因素,像這樣: regions VE PU PR DE NU AD DE NO AD 我試圖提取這些作爲列序列,其中的圖2和3的長度,然後通過向下移動1行並重復,直到結束。重複和訂購禮物。我想借此之上,使它看起來像這樣: s1 s2 VE PU PU PR PR DE DE NU NU

    0熱度

    1回答

    包arules能夠快速讀取交易的數據(挖掘關聯規則和頻繁項集),它是用專用transactions-class實現。我們也可以快速地從這個包創建使用itemFrequencyPlot功能比較原始和枯燥的項目頻率圖(有一些參數定製): library(arules) data("Groceries") itemFrequencyPlot(Groceries, topN = 20) 我想重現這

    1熱度

    1回答

    我一直在使用arules程序包和apriori算法來爲一組事務創建​​一些規則。現在我有了一些規則,我很好奇如何實現它們 - 無論是在R還是在SQL Server 2008 R2中。 有沒有人有這樣做的經驗?看起來該包可以編寫一個PMML文件,但我找不到如何將其轉換爲SQL的示例。該軟件包還具有預測功能,但它似乎用於評分聚類。

    3熱度

    2回答

    我的目標是使用由R包arules生成的規則來預測每個事務(每個事務有1個主題)的topic,其中每個事務是一組文件。我有一套訓練集trans.train(用於創建規則)和測試集trans.test(我想預測「主題」)。我也希望能夠測試這些預測(規則右側的百分比是正確的話題)。 我能夠確保每條規則的右側是一個主題(如topic = earn),左側是文檔中的任何其他單詞。所以我所有的規則有以下形式:

    0熱度

    1回答

    我使用arules的apriori算法從相對較小的事務列表中生成了頻繁項目集列表。我還計算了每個這些項目組的升力。 itemsets <- apriori(data=TransMat, parameter=list(supp=0.1, maxlen=4, target="frequent itemsets")) quality(itemsets)$lift <- interestMeasure