我是全新的data.table
程序包,似乎陷入了一個非常基本的,有些奇怪的問題。我無法發佈我正在使用的確切數據集,對此我表示歉意 - 但我認爲這個問題很簡單,足以說清楚,希望這個問題仍然非常清楚。如何通過變量傳遞參數到data.table [J()]
比方說,我有一個data.table像這樣,與主要X:
set1
x y
1: 1 a
2: 1 b
3: 1 c
4: 2 a
我想返回的set1
包含所有行x == 1
一個子集。這在data.table中非常簡單:set1[J(1)]
。巴姆。完成。我也可以分配z <- 1
,並致電set1[J(z)]
。再說一遍:效果很好。
...除了當我試圖擴大到我的實際數據集,其中包含約6M行。當我打電話給set1[J(1674)]
時,我得到了一個78行的回報,這正是我要找的。但我需要能夠查找(字面上)4M這些子集。當我將要搜索的值分配給變量id <- 1674
並致電set1[J(id)]
... R幾乎取消了我的桌面。
很明顯東西我不明白是在data.table下進行的,但我一直無法弄清楚什麼。通過堆棧溢出谷歌和ogging,表明這應該工作。出於純粹的妄想,我試過了:
id <- quote(1674)
set1[J(eval(id))]
......但那遠遠差得多。什麼......發生了什麼事?
你能提供一些關於R打印出來的更多細節嗎? –
是的,沒有。是的,我可以提供更多的細節 - 但R不打印任何*。根據'top',當我調用'set1 [J(id)]'時,rsession開始使用高達97%的系統內存。直到我設法在一段時間後終止rsession進程之後,這個盒子才變得功能無法使用。這與'set1 [J(1674)]'相反,只要我按下'enter',它就返回78行。 – Gastove
是你的data.table set1中的一列ID – mnel