-1
特定列我有一個數據幀這樣,如何找到的數據幀的頻率分佈相對於使用大熊貓在python
df,
A B C D Final
a b c d Valid
a c Valid
a c d Valid
a Valid
欲計算每個本列的多少%的最終專欄。
我期望的輸出,
output = a=4,b=1,c=3,d=2
請幫
特定列我有一個數據幀這樣,如何找到的數據幀的頻率分佈相對於使用大熊貓在python
df,
A B C D Final
a b c d Valid
a c Valid
a c d Valid
a Valid
欲計算每個本列的多少%的最終專欄。
我期望的輸出,
output = a=4,b=1,c=3,d=2
請幫
print (df)
A B C D Final
0 a b c d Valid
1 a NaN c NaN Valid
2 a NaN c d Valid
3 a NaN NaN NaN Valid
df = df.drop('Final', axis=1).count()
print (df)
A 4
B 1
C 3
D 2
dtype: int64
如果值是空字符串首先由eq
和sum
比較True
s:
print (df)
A B C D Final
0 a b c d Valid
1 a c Valid
2 a c d Valid
3 a Valid
df = df.drop('Final', axis=1).ne('').sum()
print (df)
A 4
B 1
C 3
D 2
dtype: int64
print (df.to_dict())
{'B': 1, 'A': 4, 'C': 3, 'D': 2}
d = df.div(len(df.index)).mul(100).to_dict()
print (d)
{'B': 25.0, 'A': 100.0, 'C': 75.0, 'D': 50.0}
是否有可能得到列名和值在字典中如A:4,B:1,C:3,d:2 – pyd
當然,最後添加'to_dict()' – jezrael
實際上我試圖得到每列相對於最後一列的百分比, 我想要像A:100,B:25,C:75,D:50 – pyd