我在四個獨立的實驗中使用tapply壓縮在多種條件下生長的多種植物的大型數據集。 tapply然後吐出物種總結的輸出。我試圖將這些單獨的物種從輸出中提取出來用於進一步分析。所以,tapply給我這個(從一些虛擬數據): > tapply(results, list(trial,condition,species),mean)
>
, , species1
A B C
我有一年的數據框(2006年至2010年),4個行業部門,150個公司名稱和這些公司的淨收入。總共有750個觀察值,每個企業每年有一個觀察值。我想根據五分制在每個行業年度內爲企業的收入分數。因此,每個行業年度收入在前20%的公司得分爲5分,接下來的20%得分爲4分,依此類推。底部20%的分數爲1 樣本數據的基礎是: Year Industry Firm Income
2006 Chemicals
我有一個數據幀的構造是這樣的: SecTicker Price
[1] X 10
[2] X 12
[3] X 11
[4] Y 5
[5] Y 8
[6] Y 4
etc...
我想插入具有安全每一天的回報列,所以有點像這樣 SecTicker Price ret
[1] X 10 NA
[2] X 12 .2
[3] X 11
我想處理清單列表。具體而言,我想通過分組變量(每個列表的第一個成員)提取每個列表的第三個成員的數據框,然後使用諸如mean(),median(),sd(),length()等幾個函數該組中的數據。輸出然後在數據幀返回,看起來像: Grp mean sd ...
a 5.26 ... ...
b 6.25 ... ...
#fake data
test<-list(
#membe
我想比較兩個數據集在不同的箱子。我輸入的數據是這樣的: dataIn <- read.table(text =
"bin_slots val_cases val_controls
A 0.075 0.05
A 0.252 0.276
A 0.338 0.41
A 0.911 0.983
A 0.912 0.809
A 0.965 0.917
A 1 1
A 1 1
A 0 0