甲非索引DF包含基因的行中,包含在該基因中的突變的細胞,和突變的在該基因的類型的文件:樞軸熊貓數據幀使用掩蔽
df = pd.DataFrame({'gene': ['one','one','one','two','two','two','three'],
'cell': ['A', 'A', 'C', 'A', 'B', 'C','A'],
'mutation': ['frameshift', 'missense', 'nonsense', '3UTR', '3UTR', '3UTR', '3UTR']})
DF:
cell gene mutation
0 A one frameshift
1 A one missense
2 C one nonsense
3 A two 3UTR
4 B two 3UTR
5 C two 3UTR
6 A three 3UTR
我想旋轉此df,以便我可以通過基因進行索引並將列設置爲單元格。問題在於每個細胞可能有多個條目:給定細胞中的任何一個基因可能存在多個突變(細胞A在基因One中有兩個不同的突變)。所以,當我運行:
df.pivot_table(index='gene', columns='cell', values='mutation')
發生這種情況:
DataError: No numeric types to aggregate
我想使用屏蔽來執行,同時捕捉的存在樞軸在至少一個突變:
A B C
gene
one 1 1 1
two 0 1 0
three 1 1 0