2017-06-29 64 views
-1

我有一些數據,看起來像這樣轉換CSV值列到單獨列使用二進制的答案

ColumnName 
value 1, value 2 
value 1, value 3 

我想消除此列,而是與每個值的列替換,像這樣。

value 1 value 2 value 3 
1  1  0 
1  0  1 

是否有庫/函數調用可以幫我照顧這件事?我已經看到了R中有來自splitstackshape庫基本相當於稱爲Csplit_e

回答

1

嘗試:

import pandas as pd 


df = pd.DataFrame({'ColumnName': ['value 1, value 2', 'value 1, value 3']}) 


#   ColumnName 
# 0 value 1, value 2 
# 1 value 1, value 3 

pd.get_dummies(df.ColumnName.str.split(',', expand=True), prefix='', prefix_sep='') 


# value 1 value 2 value 3 
# 0  1   1   0 
# 1  1   0   1 

我希望這有助於。

+0

正是我所需要的,謝謝! –