1
我下面就Udemy機器學習課程,教師寫了下面的一段R代碼裏面,平均差異下面的代碼聲明
dataset = read.csv("../data.csv")
dataset$Age = ifelse(is.na(dataset$Age),
ave(dataset$Age, FUN = function(x) mean(x, na.rm=T)), dataset$Age)
,以填補缺失值我試圖重新編寫代碼和沒有使用ave
函數,而是直接調用下面的mean
函數。
dataset$Age= ifelse(is.na(dataset$Age),
mean(dataset$Age, na.rm = T), dataset$Age)
上述語句都返回了相同的結果。
然後,我讀了ave
函數的手冊,它計算了因素組合水平的組合平均值,這些都超過了我的腦海。
想知道兩種方法之間有什麼根本區別,或者只是一個偏好問題。