我目前正在使用從Excel導入的數據框。數據幀的頭看起來是這樣的:分別循環遍歷數據幀的每一列
CRED ACBA PAYMS PUR
0 0 2 2 2
1 0 4 2 2
2 0 1 2 3
3 1 1 2 2
4 0 2 4 3
我再這個數據幀到一個較小的數據幀進行時CRED = 1
df_CRED1 = df_original[df_original.CRED == 1]
我採用下列操作欄「木神」
list_frequency_cred1 = [df_CRED1['ACBA'].value_counts()]
frequency_cred1_total = sum(df_CRED1['ACBA'].value_counts())
matrix_frequency_cred1 = DataFrame(data = list_frequency_cred1)
matrix_frequency_cred1['Total'] = frequency_cred1_total
matrix_frequency_cred1.rename(index = {'ACBA':'CRED1'}, inplace=True)
爲了獲得下表:
1 2 3 4 Total
CRED1 9 11 1 7 28
我現在正在創建一個循環,將適用於以獲得單獨的頻率表對每列我做了列ACBA所有其他列這樣的操作順序:
ACBA
1 2 3 4 Total
CRED1 9 11 1 7 28
PAYMS
1 2 3 4 Total
CRED1 4 5 6 7 22
etc...
我不明白如何設置循環以便分別考慮每列。後來在我的代碼中,我將不得不將其他操作應用於相同的數據框,所以我想了解基礎邏輯(而不是查找與頻率相關的函數)。謝謝
是,我肯定會在某個時候優化它。謝謝你的回答,它的工作! – Dine