更有效的方式：從列表中選擇VEC

假設更有效的方式：從列表中選擇VEC

x = c(1, 2, 3.5, 4, 6, 7.5, 8, 9, 10, 11.5, 12) 
y = c(2.5, 6.5) 
I = split(x, findInterval(x, y)) 
f = function(vec, x) { 
     d = pmax(outer(x, vec, "-"), 0) 
     colSums(d - d^2/2) 
}

我想計算的f(I[[i]], x)值在每個區間的每一個值，然後找到其I[[i]]實際值有f(I[[i]], x)在每個最大值間隔。是否有比這更有效的循環任何其他方式：

for (i in 1:length(I)) { 
    max.values[[i]] = I[[i]][which.max(f(I[[i]], x))] 
}

這是我想要得到的結果是：

> max.values 
[1] 2 6 10

來源

2012-05-01 Bensor Beny

您的第二段代碼似乎錯誤爲'max.values'不存在。我想你首先需要一個'max.values < - NULL'。 – thelatemail

如果你在去除for循環只是感興趣。你可以用一個lapply（。）替換它：

max.values <- unlist(lapply(I, function(v) v[which.max(f(v, x))]));

這隻會在長度（I）很大時纔會有所作用。爲了獲得更多的性能，請查看您是否可以簡化f（。）以僅用於查找最大值。爲了獲得最佳優化，您應該考慮重寫C，C++或Fortran中的性能關鍵部分。

R可能是可怕當數據向量變大，當存在冗長的循環時，或者當可用數據結構不適合任務時，速度變慢。就像一個軼事，我寫了一個「for-loop」無用的R代碼，在Wall time的兩週後（輸入數組：n〜1e6）被殺死。（R代碼在n〜1e4輸入時運行良好）。 C++等價代碼花了1分鐘。稍微更優化的C++代碼需要10秒...

來源

2012-05-01 03:20:57

謝謝你的幫助。 –

這是更緊湊，但我不知道它的效率更高......

v <- sapply(lapply(I,f,x=x),which.max) 
mapply(getElement,I,v)

來源

2012-05-01 03:06:14

你可以做

mapply('[', I, lapply(lapply(I, f, x), which.max)) 
# 0 1 2 
# 2 6 10

這裏是中間步驟：

lapply(I, f, x) 
# $`0` 
# [1] -190.875 -142.375 
# 
# $`1` 
# [1] -85.75 -70.75 -26.75 
# 
# $`2` 
# [1] -9.500 -6.125 -1.625 0.375 0.375 0.000 

lapply(lapply(I, f, x), which.max) 
# $`0` 
# [1] 2 
# 
# $`1` 
# [1] 3 
# 
# $`2` 
# [1] 4

來源

2012-05-01 03:06:56 flodel

謝謝你的幫助。 –

更有效的方式：從列表中選擇VEC

回答

相關問題