這裏是我心目中的問題,給定一個表如何分割一列到多列和計算頻率
Id type
0 1 [a,b]
1 2 [c]
2 3 [a,d]
我想把它轉換成形式:
Id a b c d
0 1 1 1 0 0
1 2 0 0 1 0
2 3 1 0 0 1
我需要一個非常有效的方式來轉換大型表格。歡迎任何評論。
====================================
我已經收到了一些很好的答案,非常感謝你的幫助。
現在出現了一個新問題,這是我的筆記本電腦內存不足以通過使用pd.dummies
生成整個數據幀。
有無論如何生成一個行和堆棧然後在一起的稀疏矢量?
您是否知道'''事先可能發生的所有可能的值? – shanmuga
@shanmuga,是的,我可以事先快速計算所有不同的類型 –
您的'type'列是由字符串還是字符串列表組成? – DSM