此問題是對StackOverflow問題的擴展,要求並回答了here。有效計算數據幀列的百分位數
我的情況不同,因爲我想計算50,000(或更多!)值向量中每個值的百分位數。例如 -
df <- data.frame(val = rnorm(n = 50000, mean = 50, sd = 20))
df$val.percentile <- sapply(X = df$val, function(x) ecdf(df$val)(x))
head(df)
是否有一種很好的方法來優化計算每個值的百分位數的過程?基本上我想盡可能地提高效率,因此運行時間儘可能小。
這個答案與我的不同嗎? –
@ 42-它不是,但你和巴克幾乎同時發佈(巴克是第一個) – Jaap
呵呵,當我發佈(或正在做我的編輯)時沒有看到它。我假設它遲到了。 –