我有一個data.table
,硬盤上保存了3000萬行和15列(大小177 MB,文件1)。我將這些數據加載到R中,處理它,然後再向其添加8列(行保持不變)並將它作爲.RData
文件再次保存,但是這次它的大小減少了(144 MB,文件2)。向數據表添加更多列減小.RData對象的大小
這怎麼可能?如果我添加了更多列,不應該增加.RData
文件的大小嗎?
編輯:初始文件是data.table(在R),我將它存儲爲硬盤上的.RData(文件1,177 MB)。然後我將它加載回R中,處理它,添加更多的列(行保持不變)並保存回來(文件2,144 MB)。
.RData是一個佔用較少存儲空間的壓縮文件。因此對於存儲R對象更有用。 – MAPK
原始數據的格式是什麼?它是一個文本文件(例如CSV)還是一個'.RData'文件?另外,您可以發佈一個可重現的例子(例如,模擬數據,寫入數據,讀取數據,然後再保存)? –