我是Python的新手,我想要執行以下操作。我有一個csv文件(input.csv),它包含一個標題行和4列。這個csv文件的一部分如下所示:保留具有特定列的最大值的行
gene-name p-value stepup(p-value) fold-change
IFIT1 6.79175E-005 0.0874312 96.0464
IFITM1 0.00304362 0.290752 86.3192
IFIT1 0.000439152 0.145488 81.499
IFIT3 5.87135E-005 0.0838258 77.1737
RSAD2 6.7615E-006 0.0685623 141.898
RSAD2 3.98875E-005 0.0760279 136.772
IFITM1 0.00176673 0.230063 72.0445
我想只保留與倍數變化的最高值的行,並刪除含有相同基因名稱的所有其他行與倍數變化的較低值。例如,在這種情況下,我需要以下格式的CSV輸出文件:
gene-name p-value stepup(p-value) fold-change
IFIT1 6.79175E-005 0.0874312 96.0464
IFITM1 0.00304362 0.290752 86.3192
RSAD2 6.7615E-006 0.0685623 141.898
IFIT3 5.87135E-005 0.0838258 77.1737
,如果你提供我一個解決這個問題,我會感激你的。
非常感謝。
你到目前爲止嘗試過什麼? –
你嘗試過什麼嗎?發佈您的代碼.... – Dadep
我嘗試首先按名稱排序,然後使用df.sort保留基因的第一個最高摺疊值,但沒有成功。 –