我有一個包含各個樣本的各個區域的依次列表。我想製作一個數據框,以便每行(樣本)都存在或不存在相應的區域(列)。例如,數據可能是這樣的:Python:使用基於獨立值的列創建大熊貓數據框,位於依賴列表中
region_list = [['North America'], ['North America', 'South America'], ['Asia'], ['North America', 'Asia', 'Australia']]
和最終數據框會是這個樣子:
North America South America Asia Australia
1 0 0 0
1 1 0 0
0 0 1 0
1 0 1 1
我想我可以使用依偎循環可能想出一個辦法,並附加,但是否有更pythonic的方式來做到這一點?也許用numpy.where
?
還有另一個piRSquared技巧,我將不得不記住。 「.str.get_dummies的默認值爲'|'。」 +1 –
這真的很棒。不知道有甚麼'get_dummies()'爲'str' –
感謝您的友好的話:-) – piRSquared