我有一個示例數據框,如下所述。我試圖通過按'Sample_ID'列將它們分組在一起來計算每列的數據。也就是說,我會根據每個'Sample_ID'組(1,2和3)計算第一列的平均值和標準偏差。我可以做一個甚至幾個專欄。對於我的新數據,我有100列。按每列分組計算一次
df = pd.DataFrame([[1, 1.0, 2.3,0.2,0.53], [2, 3.35, 2.0,0.2,0.65], [2,3.4,
2.0,0.25,0.55], [3,3.4,2.0,0.25,0.55], [1,3.4,2.0,0.25,0.55],
[3,3.4,2.0,0.25,0.55]],
columns=["Sample_ID", "NaX", "NaU","OC","EC"])\
.set_index('Sample_ID')
有沒有一種方法可以遍歷每一列並保存它們?以下是一列數據的計算示例,我需要對100列數據進行計算。
感謝您閱讀本文!
OC_UNC=100*np.sqrt((((df.groupby(['Sample_ID'])['OC'].std()
/df.groupby(['Sample_ID'])['OC'].mean())**2).sum()
)/len((df.groupby(['Sample_ID'])['OC'].count())))
謝謝!這很好,'agg'功能比我想要的要多得多。 Python很棒。 –
@SureshRaja,不客氣。我會說Python很棒,Pandas非常棒! ;-) – MaxU