2014-07-08 27 views
-2

這是一個類的任務,所以我不能給主要問題。我們必須對提供給我們上傳的特定數據進行子集劃分。假設我們給了它變量名稱mydata。它是csv格式的excel表單文件。所以,我們已經上傳了它,並已經完成了其他問題。這是以這種方式上傳的。 mydata < - read.csv(name_of_file)在R中上傳數據框

mydata有六個包含標題的列。現在,假設列名如下:abc efg hij klm nop qrs。現在,問題是這樣的:

「提取數據,其中abc值是< 50和klm < 100.這個子集中hij的平均值是多少?」

我知道的意思是mean()。然而,我怎樣才能提取所有的值在同一時間這個大表的子表,所以我知道,這兩個約束都滿足,我可以看到hij,所以我可以採取它的意思。請不要告訴我如何表達自己的看法,因爲這是考試的一個測驗。我會自己找到它。然而,請告訴我如何提取所有這些約束和提取必須是完整的子數據,所以我可以看到hij。請不要使用功能。這是第一次測試。適用於第二次測試。

回答

0

如果dat是數據集

subDat <- subset(dat, abc <50 & klm <100) 

您可以從subDat發現平均像你描述。

+0

謝謝。我解決了所有問題。有效! – user3794490

0

另一種方式來子集(對原始數據集MYDATA)

subData <- mydata[mydata$abc < 50 & mydata$klm < 100, ] 

這將選擇在滿足標準數據幀中的所有行。逗號後的空白表示將返回所有匹配行的列(在dataframe subData中)。

+0

謝謝。我相信你的解決方案也可以工作,我會嘗試看看。但是,我已經使用了akrun的答案,它解決了我在測驗中遇到的所有問題。再次謝謝你。 – user3794490