非平等加入，然後按羣組總結

這是一個MWE。非平等加入，然後按羣組總結

dta <- data.table(id=rep(1:2, each=5), seq=rep(1:5, 2), val=1:10) 
dtb <- data.table(id=c(1, 1, 2, 2), fil=c(2, 3, 3, 4)) 
dtc <- data.table(id=c(1, 1, 2, 2), mval=rep(0, 4)) 
for (ind in 1:4) dtc$mval[ind] <- mean(dta$val [dta$id == dtb$id[ind] & dta$seq < dtb$fil[ind]]) 

dtc 
# id  mval 
# 1: 1  1.0 
# 2: 1  1.5 
# 3: 2  6.5 
# 4: 2  7.0

dtc應該與dtb具有相同的行數。對於每一個（行）ind在DTC，

dtc$id[ind] = dtb$id[ind]。
dtc$mval[ind] = mean(dta$val[x])，其中x是dta$id == dtb$id[ind] & dta$seq < dtb$fil[ind]。

我的data.tables非常大。因此，我正在尋找一種以最小內存佔用來實現上述功能的方法。我正在考慮一個非平等加入，然後進行總結，但我似乎無法得到這個工作。因此，問題的標題。

將不勝感激任何幫助，謝謝！

來源

2016-09-18 Anirban Mukherjee

可能是這個幫助

dtc[, mval := dta[dtb, mean(val) ,on =.(id, seq < fil), by = .EACHI]$V1] 
dtc 
# id mval 
#1: 1 1.0 
#2: 1 1.5 
#3: 2 6.5 
#4: 2 7.0

來源

2016-09-18 08:34:31 akrun

非平等加入，然後按羣組總結

回答

相關問題