在scikit-learn tutorial here之後,如果我們有一個Pandas.DataFrame
,它有一個名爲colors
的列,我們如何創建循環以遍歷所有DataFrame的列(或包含所需列的列表),使得所有範疇變量(例如,變量colors
可以具有值blue
,red
,purple
)將由len(colors)
數虛擬變量列colors#blue
,colors#red
,colors#purple
的取代?將創建新的Pandas.DataFrame列的循環
剛剛學過python,所以我會在一些僞代碼中寫下我的想法。
嘗試(僞代碼)
cols_to_process = ['colors']
# Create new columns for dummy variables
// if listings.keyname in cols_to_process:
// unique_values = list of unique values in listings[col]
// listings = listings.join(unique_values, axis=1)
# Populate dummy variable columns
# Remove old columns that have dummy variable columns created