假設我有一個表作爲這樣:的R - 估計缺失值
Date Sales
09/01/2017 9000
09/02/2017 12000
09/03/2017 0
09/04/2017 11000
09/05/2017 14400
09/06/2017 0
09/07/2017 0
09/08/2017 21000
09/09/2017 15000
09/10/2017 23100
09/11/2017 0
09/12/2017 32000
09/13/2017 8000
在表中的值,通過該本人都進不去的R程序估計(這是一個黑色盒子現在)。由於我們的攝取/ ETL過程中存在問題,現在有幾天有0個值趨於蠕變。我需要估計0個數據的日期值。
我們的做法是:
- 繪製從日線之前丟失的數據的日期權 後丟失的數據
- 估計從線丟失日期值
現在,如果只有一天在兩個好日子之間缺少數據,那麼直截了當的意思是可行的。如果連續兩天或更多的數據缺失,平均值將不起作用,所以我試圖制定一種方法來估算多個數據點的值。
會在讀該方法的工作?我在R的總數n00b,所以我不確定這是否可行。
回答以下的作品,但你也可以完成同樣的事情用'zoo'包和'na.spline' – CCurtis