tapply

    0熱度

    1回答

    我在四個獨立的實驗中使用tapply壓縮在多種條件下生長的多種植物的大型數據集。 tapply然後吐出物種總結的輸出。我試圖將這些單獨的物種從輸出中提取出來用於進一步分析。所以,tapply給我這個(從一些虛擬數據): > tapply(results, list(trial,condition,species),mean) > , , species1 A B C

    2熱度

    2回答

    我有一個數據框有2列:'銷售'和'月'。我想添加一個在每個月內對銷售進行排名的列。有誰知道最簡單的方法是什麼?我在考慮'tapply',但它給了我一個列表,我不能將它添加回數據框(簡單或簡潔)。 Sales Month Rank 100 1 3 200 2 1 300 3 1 150 1 2 220 1 1 100 is third place amongst

    -1熱度

    1回答

    我意識到這個問題以前已經被問到過,並且有人建議使用ggplot,lattice等。我的問題涉及根據分類變量將平均值添加到boxplot上。 這裏是我的代碼,它不工作: STEP 1: :我使用tapply根據產婦肥胖組的年齡獲得BMI z分數的平均值值4年內製作矢量 means <- tapply(therapy$zbmi_4,therapy$Gruppe,mean,na.rm=TRUE) # c

    1熱度

    1回答

    (這是我的第一個問題,所以請讓我知道,如果我沒有問它正確,並請您分享我如何能提高我的問題問的技能的一些反饋) 我的數據集,名爲DS,是一個具有三列和4000+觀察值的矩陣。 DS中的三列分別是: name v2 f1 名字是性格 v2是數字 F1是與54個水平 我想找到最小的位置因素對於因子x的v2。我試過如下 tapply(ds$v2, ds$f1 == x, which.min) 使用

    2熱度

    1回答

    我有一年的數據框(2006年至2010年),4個行業部門,150個公司名稱和這些公司的淨收入。總共有750個觀察值,每個企業每年有一個觀察值。我想根據五分制在每個行業年度內爲企業的收入分數。因此,每個行業年度收入在前20%的公司得分爲5分,接下來的20%得分爲4分,依此類推。底部20%的分數爲1 樣本數據的基礎是: Year Industry Firm Income 2006 Chemicals

    0熱度

    2回答

    我有一個數據幀的構造是這樣的: SecTicker Price [1] X 10 [2] X 12 [3] X 11 [4] Y 5 [5] Y 8 [6] Y 4 etc... 我想插入具有安全每一天的回報列,所以有點像這樣 SecTicker Price ret [1] X 10 NA [2] X 12 .2 [3] X 11

    0熱度

    1回答

    我想處理清單列表。具體而言,我想通過分組變量(每個列表的第一個成員)提取每個列表的第三個成員的數據框,然後使用諸如mean(),median(),sd(),length()等幾個函數該組中的數據。輸出然後在數據幀返回,看起來像: Grp mean sd ... a 5.26 ... ... b 6.25 ... ... #fake data test<-list( #membe

    0熱度

    1回答

    a<-c(1,2,3) b<-c("apple","orange","fruits") f<-c(10,12,30) df<-data.frame(a,b,f) 引用時,當我運行R.Getting錯誤使用tapply()爲數據幀: prices<-tapply(df[1]*df[3],df[2],cumsum) 我得到這個錯誤: #Error in tapply(df[1] * df

    -1熱度

    1回答

    我想比較兩個數據集在不同的箱子。我輸入的數據是這樣的: dataIn <- read.table(text = "bin_slots val_cases val_controls A 0.075 0.05 A 0.252 0.276 A 0.338 0.41 A 0.911 0.983 A 0.912 0.809 A 0.965 0.917 A 1 1 A 1 1 A 0 0

    2熱度

    1回答

    組 所有值我有類似這樣的 ID <- c(1,1,1,1,1,2,2,2,2,2,3,3,3,3,3) p1 <- c(21000, 23400, 26800, 2345, 23464, 34563, 456433, 56543, 34543,3524, 353, 3432, 4542, 6343, 4534) p2 <- c(234235, 2342342, 32, 23432, 23423