2017-10-11 69 views
0

我希望計算只有在值發生變化時記錄的時間序列數據集的平均值和標準偏差。數據集記錄的平均/標準計算值的更改僅爲

時間序列的間隔爲1秒,如果生成每個更改之間的缺失值,則存在數據集膨脹的風險。數據組類型的

實施例:[時代,值]

[[152345235, 3], [152345335, 12], [152345835, 8]] 

我們正在使用的清潔Python和聚集的數據。稀疏矩陣是不夠的,因爲它基於忽略不存在的0值。在研究方面,沒有任何證據表明可以很快解決這個問題。

我的問題是,有沒有人遇到類似的問題,如果是的話,用什麼技術來解決。

+1

意思就是sum()/ n,你應該知道n是什麼。 std有點難度,但同樣的基本方法將起作用。你只需要(0-均值)*(n-x)其中x是非零數。 – JohnE

回答

1

我會通過epoch訂購清單,然後將value乘以epochs之間的差異。你不需要以這種方式存儲額外的數據,但你可以很容易地解決這個問題。