data.table

    1熱度

    2回答

    我有兩個數據幀(db1和db2),我想在db2中找到與db1中的某些參數匹配的位置。這可以通過使用for循環如下實現: db1 <- data.frame(id=rep(1:4,each=4), class=sample(1:10, 16, replace=TRUE), var=rnorm(16) ) db2 <- expand.grid(id

    3熱度

    3回答

    我在問這是一個關於R的通用/初學者問題,並非特定於我正在使用的軟件包。 我有一個dataframe與300萬行和15列。我不認爲這是一個巨大的數據框,但也許我錯了。 我正在運行下面的腳本,它已運行了2個半小時以上 - 我想我必須做些事情來加快速度。 代碼: ddply(orders, .(ClientID), NumOrders=len(OrderID)) 這不是一個過於密集的腳本,或再次,我

    5熱度

    3回答

    我有兩個數據框;一個是48行長和看起來像這樣: 名稱= Z31 Est.Date Site Cultivar Planting 1 24/07/2011 Birchip Axe 1 2 08/08/2011 Birchip Bolac 1 3 24/07/2011 Birchip Derrimut 1 4 12/08/2011 Birchip Eaglehawk 1 5 2

    2熱度

    2回答

    我必須根據特定條件從數據框中選擇一堆數據。數據幀看上去大致是這樣的: F1 F2 D1 D2 1 A1 B1 1 0 2 A1 B1 1 1 3 A1 B1 0 0 4 A1 B2 1 0 5 A1 B2 0 0 6 A2 B2 1 0 7 A2 B2 1 1 的Fx的因素,並且是Dx數據值。我需要做的是以下幾點: 查找具有與特定模式匹配的數據值的行。 對於每個與該模式相匹配的行

    4熱度

    3回答

    我正試圖在給定列上使用max函數來減少數據幀。我想保留其他列,但保留來自選擇每個最大值的相同行的值。一個例子會使這個解釋更容易。 讓我們假設我們有以下的數據幀: dframe <- data.frame(list(BENCH=sort(rep(letters[1:4], 4)), CFG=rep(1:4, 4), VALUE=runif(4 * 4)

    9熱度

    1回答

    我有一個像下面的數據框(20,000行49列)。每行具有唯一的名稱(ID),每個ID在3列中有3個重複讀數(例如D15C D15C.1 D15C.2)。名稱的前4個字母(「D15C」)是組名。我需要通過組名來平均列(例如平均D15C,D15C.1和D15.2以獲得D15C),因此最終表將從49列合併爲16列。 ID D04C D04C.1 D08H D08H.1 D08H.2 D15C D15

    0熱度

    1回答

    我有一個包含價格和數量的xts對象。我希望按時間段分割數據並彙總數據,以便獲得每個時間段分段的每個價格交易的交易量表。 我已經破解了一個部分解決方案,但它笨拙而緩慢;此外,我無法使用模板名稱來工作(所以我不能讓我的功能工作)。 的XTS對象的子集如下所示: library(xts) mn <- structure(c(97.9, 97.9, 97.9, 97.9, 97.9, 97.9, 97

    23熱度

    1回答

    我有一個data.frame在R與1900萬行和90列。我有足夠的備用RAM和CPU週期。看來,在這個數據幀改變一個列名是R. system.time(colnames(my.df)[1] <- "foo") user system elapsed 356.88 16.54 373.39 一個非常激烈的操作,爲什麼會這樣呢?每行都以某種方式存儲列名?這是否會創建一個全新的數據框?看

    3熱度

    2回答

    我不知道是否有人有一個想法,如何以更好的方式計算組合如下,比我想象的。 > library(lubridate) > df <- data.frame(x=sample(now()+hours(1:3), 100, T), y=sample(1:4, 100, T)) > with(df, as.data.frame(table(x, y))) x y Freq 1 201

    5熱度

    3回答

    我有一個數據框是大約35,000行,由7列。它看起來像這樣: 頭(NUC) chr feature start end gene_id pctAT pctGC length 1 1 CDS 67000042 67000051 NM_032291 0.600000 0.400000 10 2 1 CDS 67091530 67091593 NM_032291 0.609375 0.390