我以菱形數據集爲例。我可以通過剪切和顏色分割數據集,然後應用模型並提取r-平方,如下所示。如何拆分某些列的某些子級別的數據框並在全局應用模型
diamonds %>% group_by(cut, color) %>%
do(model=lm(price~carat, data=.)) %>%
mutate(r2 = summary(model)$adj.r.squared) %>%
select(-model)
問題是,如果我只想通過剪切和顏色中的某些子級別對數據進行分組。例如:
cut_sub<- as.factor(c('Good','Fair'))
color_sub <- as.factor(c('E', 'J'))
我應該如何修改上面的代碼以實現該目的?我嘗試了Google搜索,但找不到解決方案。
爲什麼不乾脆用' filter()'並且只保留rele vant數據?例如:'diamonds%>%filter(%c(「Fair」,「Good」)中的剪切%,%c(「E」,「J」)中的顏色%)%>%group_by(剪切,顏色)% >%...' –