2013-09-25 55 views
0

讓我們再來看看。這次我嘗試了包括數據。對數據集中的兩行進行平均,基於它們在另一列中具有相同的值,

我有一個108行和654列(圖爲8個初始列的樣本)的數據集。我在這裏有54個不同的樣本,我有兩個讀數。我想平均每個克隆(第2列)的吸光度列[6:653](克隆格式化爲'11 -45-N')。有一個讀數A和一個讀數B.這些需要進行平均,然後放入一個新表格中,並且這個新表格必須保留第1,2,3和654列中的數據(這些單元格用於讀取兩個數據,但不一定是數字,你可以看到)。例如,新表格的第一行的前3列應該與下面示例的第一行完全相同,但不包括'閱讀和ID'列。請注意,刪除這兩列純粹是一種生活品質,我主要要求它取得平均值,並將信息保留在其他列中。

我嘗試過使用plyrrollapply的功能,但是我對這個還是比較陌生的,不能真正弄明白。

 Reslevel clone bagnumber reading ID absorbence.8987.71322 absorbence.8979.99845 absorbence.8972.28367 
1   H 11-45-N  16  A.0 1    -1.40435    -1.40512    -1.40558 
649   H 11-45-N  16  B.0 2    -1.45466    -1.45544    -1.45590 
1297  H 8-23-N  11  A.0 3    -1.42534    -1.42613    -1.42665 
1945  H 8-23-N  11  B.0 4    -1.45738    -1.45803    -1.45853 
2593  H 8-29-N  11  A.0 5    -1.46860    -1.46937    -1.46987 
3241  H 8-29-N  11  B.0 6    -1.44404    -1.44487    -1.44543 
+0

你可以用'rowMeans'爲 – Metrics

+0

你要跨列或跨行的平均?或兩者?我現在很困惑:-) –

+0

我想平均每列。即對於克隆「11-45-N」,對於「absorbbence.8987.71322」列,其平均值爲-1.40435和-1.45466,以此類推,然後接下來的648列。 – Schmakk

回答

1

試試這個:

aggregate(. ~ Reslevel + clone + bagnumber + last_col_name, data=dataset_name, FUN=mean) 
+0

夥計,你是一個天才,我認爲這已經奏效 - 我會仔細檢查一些隨機計算,但從我已經完成的少數人來看,這已經奏效。 我愛你。 – Schmakk

相關問題