我試圖做下面的命令在python相當於:的R蟒蛇大熊貓dcast相當於
test <- data.frame(convert_me=c('Convert1','Convert2','Convert3'),
values=rnorm(3,45, 12), age_col=c('23','33','44'))
test
library(reshape2)
t <- dcast(test, values ~ convert_me+age_col, length )
t
也就是說,這樣的:
convert_me values age_col
Convert1 21.71502 23
Convert2 58.35506 33
Convert3 60.41639 44
變成這樣:
values Convert2_33 Convert1_23 Convert3_44
21.71502 0 1 0
58.35506 1 0 0
60.41639 0 0 1
我知道,用虛擬變量我可以得到列的值並轉換爲列的名稱,但有沒有辦法像R一樣容易地合併它們(組合)?
什麼是更高層次的原因,你想要做這個特定的轉型? – 2014-09-02 08:09:36
我正在創建列,以便我可以在機器學習算法中使用它。 – 2014-09-02 08:14:33
你知道R給你的是'1 + length(convert_me)* length(age_col)'的列數嗎?起初我以爲你會想要每一個獨特的年齡段的一列,但這不是R爲你做的(你可以看看你是否將相同的年齡分配到兩行)。 – 2014-09-02 08:37:26