我有一個大的矩陣(1,000,000行1,140列),我正在使用ff包存儲。 有沒有一種有效的方法來計算協方差矩陣?使用cov函數給出了以下錯誤: Error in cov(X) : supply both 'x' and 'y' or a matrix-like 'x' 考慮到cov不理解ff對象,這並不奇怪。我目前使用一個簡單的嵌套for循環: covarianceMatrix <- matr
我在這裏的「大數據處理」裏面比較新,希望能找到一些關於如何處理50 GB csv文件的建議。目前的問題是以下幾點: 表看起來像是: ID,Address,City,States,... (50 more fields of characteristics of a house)
1,1,1st street,Chicago,IL,...
# the first 1 is caused by w
我遇到內存問題,R給出Can not allocate vector of size XX Gb錯誤消息。我有一堆日常文件(12784天),以netcdf格式給出1305x378(經緯度)網格的海面溫度。這樣每天就可以得到493290分,在移除新地區(陸地點)時減少到約245000。 我的最終目標是從日常文件中爲任何245000點建立一個時間序列,並找出每個點的時間趨勢。我的想法是建立一個每行一個