2016-06-13 31 views
0

我正在拆分具有SKU和事務ID的事務文件(數據)。我想使用此文件進行使用arules庫的購物籃分析。字符串或字符在運行拆分時轉向數字,正如在r

的問題如下: 數據

sku transactionId 
GSB 1000019214173610000 
HF 1000035644171470000 
MT 1000035644171470000 
WP 1000035644171470000 
ED 1000043731010500000 
DT 1000044672723070000 
DT 1000118604897040000 
CF 1000118604897040000 
VS 1000165528585840000 

我運行:

isplit <- split(data$sku, data$transactionId) 
trn <- as(isplit, "transactions") 

當我檢查萬億的輸出,所有的SKU值轉換爲整數,而不是自己的名字如下:

{54} 1000019214173610000 
{23,35,108} 1000035644171470000 
{66} 1000043731010500000 
{23} 1000044672723070000 
{23} 1000118604897040000 
{27} 1000044672723070000 

任何想法爲什麼我失去SKU值?

+4

大膽猜測:'數據$ sku'是一個因素。嘗試在'split()'中用'as.character()'包裝它。 –

回答

0

至於建議由理查德·斯克裏文,

我包數據$ SKU與分裂as.character()。

更新的代碼:

isplit <- split(as.character(data$sku), data$transactionId)