我有一個熊貓數據框,其中包含一系列不同類型的水果在一系列不均勻分佈的日期上的一系列價格值。我想要做的是在每種水果類型的一致時間框架內插水果價格。在數據框中按組插入值 - Python
困難的部分是,目前,一些時間重疊,其他人不(見下面的例子)。我寧願不將插值的範圍擴大到所提供的日期範圍之外,因爲這會給錯誤留下太多空間。所以我沒有比較下面的水果01和02的價格,但01和03應該有一個我可以用來比較的窗口。我的目標是具有一致/重疊的日期範圍,以便比較水果價格的變化,即我應該能夠比較水果01和水果03的插入價格,比如9/21/14,9/28/14,10/5/14等
至於插值,我應該考慮什麼,因爲我考慮使用什麼類型的插值?我認爲每週價格內插就足夠了。
id date price
01 2014-09-21 3.41
01 2014-11-05 5.63
01 2015-02-22 6.22
02 2013-04-11 245.22
02 2013-05-20 250.05
03 2014-08-28 10.53
03 2014-10-01 12.43
讓我知道,如果我可以提供任何更多的信息。謝謝您的幫助!
什麼是您預期的結果? – Alexander
@Alexander我的預期結果是具有相同格式的數據框,它仍具有所有原始值,但現在也包含新插入的每週價格估計值。 – nflove
你的問題太含糊,你沒有提供什麼是預期結果的細節。例如,「我寧願不將插值擴展得超出所提供的日期範圍」。這實際上意味着什麼?而且「我可以沒有比較下面的水果01和02的價格,但01和03應該有一個我可以用來比較的窗口」你如何確定什麼是可以接受的? – Alexander