ff

    1熱度

    1回答

    我嘗試使用ff包。在這種情況下,我嘗試綁定兩個ff數據幀。我找到了一個將ffdf和ff向量結合起來的解決方案,但是我如何結合到ffdf。在這裏我對ffdf與FF矢量合成代碼: library(ff) ## read Bankfull flow## setwd(wd) bf <- read.csv.ffdf(file="G_BANKFULL_km3month.csv",header=TRUE)

    1熱度

    1回答

    我正在處理一個大型的數據集(3.5M行和40列),我需要清除一些值,這樣我才能夠計算其他參數,當我開始制定時數據模型。 問題是,它一直在使用我一直在使用的for循環,因此我想嘗試使用ff軟件包。數據框被稱爲數據,它由銀行的大量客戶信息組成。它被導入爲.csv文件。我需要做的是去除所有的客戶(標記序列),如果他們AverageStanding變量是有史以來負 > ffd<-as.ffdf(data)

    3熱度

    2回答

    我正在密集使用令人驚歎的ff和ffbase包。 由於一些技術細節,我必須在我的R會話中使用C:驅動器。完成後,我將生成的文件移到我的P:驅動器(使用剪切/粘貼在窗口中,不使用ff)。 的問題是,當我加載ffdf對象: load.ffdf("data") 我得到的錯誤: Error: file.access(filename, 0) == 0 is not TRUE 這是確定的,因爲沒有人告

    10熱度

    3回答

    我使用R的ff包,並且我需要使用一些ffdf對象(尺寸大約爲1.5M x 80)。儘管如此,我仍然遇到了一些麻煩,不知道是否有效切割/切割操作。 比如我有一個名爲「年」和「年齡」兩整列,我想使AGE的表時,這一年是2005年。 一種方法是這樣的: ffwhich <- function(x, expr) { b <- bit(nrow(x)) for(i in chunk(x)

    2熱度

    1回答

    我想通過一個日期子集FFDF。下面,我已經使用正常的數據框成功地創建了這樣一個子集。但我需要一些幫助將這個應用到FFDF。我的嘗試以及錯誤消息在代碼註釋中列出。提前謝謝了! #Create a normal data frame (in production this is read directly into an ffdf #through a csv file) start <- c(

    0熱度

    1回答

    我是R新手。 我有一個2.5 gb的大csv,3列4000萬行。該列的數據類型是整數,日期時間和字符。如何使用ff包加載此csv?

    2熱度

    2回答

    設二ffdf文件: library(ff) ff1 <- as.ffdf(data.frame(matrix(rnorm(10*10),ncol=10))) ff2 <- ff1 colnames(ff2) <- 1:10 我列如何綁定這些沒有它們加載到內存? cbind不起作用。 還有同樣的問題http://stackoverflow.com/questions/18355686/co

    2熱度

    1回答

    我正在使用在某些列中具有NAs的ffdf對象。 NAs是使用merge.ffdf進行左外部合併的結果。我想用0代替NA,但不管理它。 這裏是代碼我運行: library(ffbase) deals <- merge(deals,rk,by.x=c("DEALID","STICHTAG"),by.y=c("ID","STICHTAG"),all.x=TRUE) attribute

    0熱度

    1回答

    如何正確使用ffload中的list功能選擇性地加載ffdf的一部分? 我已經讀了很多次,有可能有選擇地加載ff數據幀的一部分,但似乎無法讓我自己工作。 我的問題是,我試圖執行與具有唯一ID列表的矢量合併,但ffdf文件太大,我的電腦無法處理此合併。 到目前爲止,我一直試圖使用ffinfo來獲得組成我的ffdf不同部分的列表。 舉例來說,我得到了下面的「文件部分」清單有問題的ffdf: ffinf

    5熱度

    1回答

    自從現在我已經使用ff包來處理大數據。我所使用的R對象大約有130.000.000行和14列。其中兩列「溫度」和「降水量」缺少「不適用」值,因此我需要刪除這些行才能繼續工作。 從來就一直在努力做像我會在一個正常的[R對象: data<-data[!is.na(data$temp),] 但我不斷收到一個錯誤: Error: vmode(index) == "integer" is not TRU