我想這是一個dplyr比plyr更多的問題。爲了提高速度,我在我寫的一些代碼中使用了data.table。期間的中間步驟我有一些基因組學與數據的表〜32,000行: > bedbin.dt
Source: local data table [32,138 x 4]
Groups: chr
bin start site chr
1 2 3500000 ssCTCF 1
2
(通過對象關係映射,我的意思是這裏描述:Wikipedia: Object-relational mapping) 這裏是我能想象在讀該工作:一種「虛擬數據幀」是鏈接到數據庫,並返回訪問時SQL查詢的結果。例如,head(virtual_list)實際上會在映射的數據庫上返回(select * from mapped_table limit 5)的結果。 我發現這post by John Myle