我的DataFrame是94列728k行。每個值都是表示顏色的字符串。我打算將每種顏色轉換爲相應的數值。熊貓:有效地改變多個列中的多個值
這是一個可重現的例子。在這個例子中,我希望將字符串轉換如下:
blue = 1
green = 2
red = 3
grey = 4
orange = 5
data = {'group1': ['red', 'grey', 'blue', 'orange'],
'group2': ['red', 'green', 'blue', 'blue'],
'group3': ['orange', 'blue', 'orange', 'green']}
data = pd.DataFrame(data)
data
group1 group2 group3
0 red red orange
1 grey green blue
2 blue blue orange
3 orange blue green
輸出將是:
group1 group2 group3
0 3 3 5
1 4 2 1
2 1 1 5
3 5 1 2
我怎麼能這樣做有效地給予我的實際數據的大小?
可能不是你在尋找什麼,但看看sklearn.preprocessing.LabelEncoder爲好。 http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.LabelEncoder.html – ayhan