我有一些數據,我正在處理數據框和熊貓。 它們包含大約10 000行和6列。重採樣非時間序列數據
問題是,我做了幾個試驗,不同的數據集有略微不同的索引號。 (這是用幾種材料進行的「力 - 長度」測試,當然測量點並不完美)
現在我的想法是,使用包含長度值的索引「重新取樣」數據。 似乎pandas中的重採樣函數僅適用於datetime數據類型。
我試圖通過to_datetime和成功轉換索引。但是在重新採樣之後,我需要回到最初的比例。某種from_datetime函數。
有什麼辦法嗎?
還是我在完全錯誤的軌道上,應該更好地使用像groupby這樣的功能?
謝謝!
編輯:
對不起,問得不夠清楚。我是一個非常沒有經驗的蟒蛇用戶,也是這個論壇的新成員。
數據類似於下面。長度被用作索引。在這些數據框中,我有幾個這樣的框架,它們可以很好地將它們全部設置爲相同的「幀率」,然後將它們剪切這樣我可以比較不同的數據集。
我已經嘗試過的想法是這樣:
df_1_dt = df_1 #generate a table for the conversion
df_1_dt.index = pd.to_datetime(df_1_dt.index, unit='s') # convert it simulating seconds.. good idea?!
df_1_dt_rs= df_1_dt # generate a df for the resampling
df_1_dt_rs = df_1_dt_rs.resample (rule='s') #resample by the generatet time
數據:
+---------------------------------------------------+
¦ Index (Lenght) ¦ Force1 ¦ Force2 ¦
¦-------------------+---------------+---------------¦
¦ 8.04662074828e-06 ¦ 4.74251270294 ¦ 4.72051584721 ¦
¦ 8.0898882798e-06 ¦ 4.72051584721 ¦ 4.72161570191 ¦
¦ 1.61797765596e-05 ¦ 4.69851899147 ¦ 4.72271555662 ¦
¦ 1.65476570973e-05 ¦ 4.65452528 ¦ 4.72491526604 ¦
¦ 2.41398605024e-05 ¦ 4.67945501539 ¦ 4.72589291467 ¦
¦ 2.42696630876e-05 ¦ 4.70438475079 ¦ 4.7268705633 ¦
¦ 9.60953101751e-05 ¦ 4.72931448619 ¦ 4.72784821192 ¦
¦ 0.00507703541206 ¦ 4.80410369237 ¦ 4.73078115781 ¦
¦ 0.00513927175509 ¦ 4.87889289856 ¦ 4.7337141037 ¦
¦ 0.00868965311878 ¦ 4.9349848032 ¦ 4.74251282215 ¦
¦ 0.00902026197556 ¦ 4.99107670784 ¦ 4.7513115406 ¦
¦ 0.00929150878827 ¦ 5.10326051712 ¦ 4.76890897751 ¦
¦ 0.0291729332784 ¦ 5.14945375919 ¦ 4.78650641441 ¦
¦ 0.0296332588857 ¦ 5.17255038023 ¦ 4.79530513287 ¦
¦ 0.0297080942518 ¦ 5.19564700127 ¦ 4.80410385132 ¦
¦ 0.0362595526707 ¦ 5.2187436223 ¦ 4.54 ¦
¦ 0.0370305483177 ¦ 5.24184024334 ¦ 4.81290256977 ¦
¦ 0.0381506204153 ¦ 5.28803348541 ¦ 4.82170128822 ¦
¦ 0.0444440795306 ¦ 5.30783069134 ¦ 4.83050000668 ¦
¦ 0.0450121369102 ¦ 5.3177292943 ¦ 4.8348993659 ¦
¦ 0.0453465140473 ¦ 5.32762789726 ¦ 4.83929872513 ¦
¦ 0.0515533437013 ¦ 5.33752650023 ¦ 4.85359662771 ¦
¦ 0.05262489708 ¦ 5.34742510319 ¦ 4.8678945303 ¦
¦ 0.0541273847206 ¦ 5.36722230911 ¦ 4.89649033546 ¦
¦ 0.0600755845953 ¦ 5.37822067738 ¦ 4.92508614063 ¦
¦ 0.0607712385295 ¦ 5.38371986151 ¦ 4.93938404322 ¦
¦ 0.0612954159368 ¦ 5.38921904564 ¦ 4.9536819458 ¦
¦ 0.0670288249293 ¦ 5.39471822977 ¦ 4.97457891703 ¦
¦ 0.0683640870058 ¦ 5.4002174139 ¦ 4.99547588825 ¦
¦ 0.0703192637772 ¦ 5.41121578217 ¦ 5.0372698307 ¦
¦ 0.0757871634772 ¦ 5.43981158733 ¦ 5.07906377316 ¦
¦ 0.0766597757545 ¦ 5.45410948992 ¦ 5.09996074438 ¦
¦ 0.077317850103 ¦ 5.4684073925 ¦ 5.12085771561 ¦
¦ 0.0825991083545 ¦ 5.48270529509 ¦ 5.13295596838 ¦
¦ 0.0841354654428 ¦ 5.49700319767 ¦ 5.14505422115 ¦
¦ 0.0865525182528 ¦ 5.52559900284 ¦ 5.1692507267 ¦
+---------------------------------------------------+
請發佈您的數據和所需的輸出一個小例子。 – unutbu
應該有其他一些方法來做到這一點,但它們取決於你想如何重新採樣。這裏重新取樣的目的是什麼?你想插入缺失值嗎?有更定期的價值觀?也許你可以描述你想要的輸出。 – ASGM