我有一個小數據幀,其中包含10個週期的值。我想總結每個值和預測值之間的絕對差值(絕對誤差)。數據幀的總和絕對差值
列標誌:P1,P2,P3,..... P10
值:3,4,3 ...... 7(見下文數據)
預測值= 5 (它不總是5)
「error」公式= | 3-5 | + | 4-5 | + | 3-5 | + .... + | 7-5 |
> data
cust P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 predict error
1 A 1 1 1 1 1 1 1 1 1 1 5 ?
2 B 3 3 3 3 3 3 3 3 3 3 5 ?
3 C 1 1 1 1 1 3 3 3 3 3 5 ?
4 D 1 0 1 0 1 0 1 0 1 0 5 ?
5 E 1 0 0 1 0 0 1 0 0 1 5 ?
6 F 1 3 1 3 1 3 1 3 1 3 5 ?
7 G 5 5 5 5 5 5 5 5 5 5 5 ?
8 H 8 8 8 8 8 8 8 8 8 8 5 ?
9 I 5 5 5 5 5 8 8 8 8 8 5 ?
10 J 5 0 5 0 5 0 5 0 5 0 5 ?
11 K 5 0 0 5 0 0 5 0 0 5 5 ?
12 L 5 8 5 8 5 8 5 8 5 8 5 ?
我可以做一個長格式的計算,但我不想重做不同大小的數據冗長凌亂的公式。最終的數據集將有更多的時間段和客戶,所以我需要一個適用於不同大小數據幀的公式/函數。我希望得到一些幫助。
我知道這可以使用預測包來完成,但我需要從底部構建它,以便我可以對結果做其他事情。
所有回覆的工作,感謝大家的幫助!我認爲dplyr是要走的路,它更容易閱讀。我打算更熟悉它並更多地使用它。再次感謝! – Paul