最近我一直在處理大型數據集(超過40萬行)。到目前爲止,我一直在使用XTS格式,該格式適用於幾十萬個元素的「小」數據集。XTS大小限制
現在項目不斷增加,R在檢索數據庫的數據並將其放入XTS時崩潰。
這是我的理解,R應該能夠有大小爲2^32-1元素(或2^64-1根據版本)的大小。因此,我得出的結論是XTS可能有一些限制,但我無法在文檔中找到答案。 (也許我對自己對理論可能的矢量大小的理解有點過分自信)。
綜上所述,我想知道,如果:
- XTS確實有大小限制
- 你認爲什麼是處理大量的時間序列的最聰明的方法是什麼? (我正在考慮將分析分成幾個較小的數據集)。
- 我沒有收到錯誤消息,R只是自動關閉。這是一個已知的行爲嗎?
SOLUTION
- 同爲R和這取決於種存儲器被使用(64位,32位)。無論如何,這是非常大的。
- Chuncking數據確實是一個好主意,但它不是必需的。
- 此問題來自R 2.11.0中的錯誤,該錯誤已在R 2.11.1中解決。長日期矢量(這裏是XTS的索引)存在問題。
R 3.0.0將允許具有> 2^32 - 1個元素的向量。它計劃在4月正式出來,但在那之前嘗試r-devel版本的R. – 2013-01-02 19:35:25