過去兩天我一直在嘗試使用RxImport函數將大型CSV(9演出)轉換爲XDF格式,但未取得成功。rxImport在大型數據集上失敗
這個過程似乎開始很順利,R服務器按塊讀取數據塊,但幾分鐘後它慢慢爬行,然後在6小時後完全失效,Windows停止服務器說它耗盡RAM 。
我正在使用的代碼如下:
pd_in_file <- RxTextData("cca_pd_entity.csv", delimiter = ",") #file to import
pd_out_file <- file.path("cca_pd_entity.xdf") #desired output file
pd_data <- rxImport(inData = pd_in_file, outFile = pd_out_file,
stringsAsFactors = TRUE, overwrite = TRUE)
我運行微軟R服務器,版本9.0.1。在一臺裝有16G RAM的Windows 7機器上。
感謝
看看設置'colInfo'參數是否有幫助 –
謝謝你的建議我會試一試。我有近300列數據,因此假設我可以導入數據的一個子集並使用rxGetVarInfo命令提取列信息並將其傳遞到rxImport命令,而不是分別手動指定每列,這是否正確? –
它的工作! Arg這真棒:D謝謝謝謝,謝謝 –