0
我有一個帶有ID變量和另一個分類變量的DataFrame。我想用get_dummies從分類變量中創建虛擬變量。在熊貓中執行get_dummies時保留其他變量
dum = pd.get_dummies(df)
但是,這使ID變量消失。我後來需要這個ID變量來合併到其他數據集。
有沒有辦法保留其他變量。在get_dummies的文檔中我找不到任何東西。謝謝!
我有一個帶有ID變量和另一個分類變量的DataFrame。我想用get_dummies從分類變量中創建虛擬變量。在熊貓中執行get_dummies時保留其他變量
dum = pd.get_dummies(df)
但是,這使ID變量消失。我後來需要這個ID變量來合併到其他數據集。
有沒有辦法保留其他變量。在get_dummies的文檔中我找不到任何東西。謝謝!
我找到了答案。您可以將傻瓜數據集連接到原始數據集,如下所示。只要您在此期間不重新排序數據。
df = pd.concat([df, dum], axis=1)
你可以給你的'df'添加一個樣本到這個問題嗎?我第一次嘗試將調用'get_dummies'時排除'ID',然後再次添加列。 – mhoff