2015-06-28 185 views
2

我有一個擁有100k個數據字段的大型數據集。當我嘗試STR()或查看沒有glitched發生的全部數據,但是當我運行在訓練軟件rpart設置需要花費一段時間後約3-4分鐘就會出現在下面的錯誤,爲大數據集調用rpart時發生錯誤

Error: Unable to establish connection with R session

我的腳本如下所示:

# Decision tree 
library(rpart)      
library(rattle)         
library(party) 

train_set <- read.table('my_sample_trainset.csv', header=TRUE, sep=',', stringsAsFactors=FALSE) 
test_set <- read.table('my_sample_testset.csv', header=TRUE, sep=',', stringsAsFactors=FALSE) 

my_trained_tree <- rpart(Route ~ Bus_Id + week_days + time_slot, data=train_set, method="class") 
# Error occurs on/after this line 

my_prediction <- predict(my_trained_tree, test_set, type = "class") 

my_solution <- data.frame(Route = my_prediction) 

write.csv(my_solution, file = "solution.csv", row.names = FALSE) 

我是否缺少圖書館?或會出現這種情況,因爲大數據集(6.5MB)

此外,我使用rStudio版本0.99.447在Mac OS X約塞米蒂

回答

1

該消息意味着,R爲仍在計算的結果。如果打開活動監視器並按CPU選項卡上的CPU使用率排序,則應該看到rsession正在使用100%的CPU。因此,您可以在該消息上單擊「確定」,並允許R保持計算。

我希望有一個解決方法,雖然這個問題困擾着我,我們說話!

+0

「我希望......」是否意味着沒有解決方法? – Dinal24