2016-03-11 89 views
0

我有一個超過4000列和3790行的數據幀。列代表公司目前每天的觀察數據。 3790行意味着15年的日常觀察。現在我想計算出,每一列的日均觀察值等於或大於100,加上在15年樣本中即從2000年1月至2014年12月爲正值。總之,我想從我的樣本中濾除出自3790以外的少於100個積極意見的公司。我的數據結構是這樣的,它缺少值,因爲公司在不同時間點列出。例如,公司在2003年年內上市,因此,所有的NAS 2003年之前,我 說明如下數據框我的結構:使用R對數據幀中的正數進行計數

Date   A  B  C 
30/12/1999 79.5 325  NA 
04/01/2000 79.5 325  NA 
05/01/2000 79.5 322.5 NA 
06/01/2000 79.5 327.5 NA 
07/01/2000 79.5 327.5 NA 
10/01/2000 79.5 327.5 NA 
11/01/2000 79.5 327.5 NA 
12/01/2000 79.5 331.5 NA 
13/01/2000 79.5 334  NA 
14/01/2000 79.5 334  NA 
17/01/2000 94.5 350  NA 
18/01/2000 95.5 351.5 NA 
19/01/2000 94.5 352.5 NA 
20/01/2000 97.5 352.5 NA 
21/01/2000 97.5 352.5 NA 
24/01/2000 97.5 352.5 NA 
25/01/2000 97.5 352.5 NA 

我很感激你在這方面的幫助。

回答

1

我們可以使用Filter

Filter(function(x) sum(x>0 & !is.na(x)) > 100, df1) 
+1

謝謝它的作品完美。 – Aquarius