2015-10-22 56 views
0

我有一個大型數據集(38053行=成績單,39列=樣本) 我想創建一個新的數據集,其中包含某組成績單的所有樣本值。R幫助 - 創建一個子數據集

x= data1["698568366",] 

作品單個轉錄物,出現的同時,「698568366」是成績單

的名字,但現在不是一個,我想用3000

我想到了一個雙牀我應該能夠使用:

data1[data1[,1] %in% 3000_m,] 

其中3000_m是矩陣形式的列表,

但是我不斷收到回

<0 Rows> (or row.names mit Length 0) 
+2

請提供可重複的例子 – Thierry

+0

嘗試'數據1 [數據1 [,1] %c(3000_m),''(未測試) – akrun

+0

data1 [! data1 [,1]%in%3000_m,] – PatriceG

回答

0

這裏有數組a和b:

a = c(1:10) 
b = c(11:20) 

創建一個數據幀與他們:

df = data.frame(a, b) 

這裏是我的索引作爲數組:

ind = c(3, 5, 7) 

Select rows inde xed as ind:

new_df = df[ind,] 

你不能使用多維數組作爲索引(據我所知)。

0

看起來您的成績單名稱實際上並未存儲在數據框的第一列,而是作爲行名稱存儲。

如果是這樣的話,如果你感興趣的成績單的名稱都存儲在一個向量myTranscripts,你可以使用:

x = data1[row.names(data1) %in% myTranscripts, ]