我有一個.dat文件,它需要一列中的數千行(比如說,列是time,t),現在我想查找間隔在列中的行之間,這意味着從第一行減去第二行的值,等等。(找到dt)。然後我想用這些間隔值創建一個新列,並將其與原始列進行比較。如果python以外的任何其他語言在這種情況下都有幫助,我也會讚賞他們的建議。
我寫了一個僞Python代碼爲:在python熊貓數據框中從前面的行中減去列的行
import pandas as pd
import numpy as np
from sys import argv
from pylab import *
import csv
script, filename = argv
# read flash.dat to a list of lists
datContent = [i.strip().split() for i in open("./flash.dat").readlines()]
# write it as a new CSV file
with open("./flash.dat", "wb") as f:
writer = csv.writer(f)
writer.writerows(datContent)
columns_to_keep = ['#time']
dataframe = pd.read_csv("./flash.csv", usecols=columns_to_keep)
df = pd.DataFrame({"#time"})
df["#time"] = df["#time"] + [pd.Timedelta(minutes=m) for m in np.random.choice(a=range(60), size=df.shape[0])]
df["value"] = np.random.normal(size=df.shape[0])
df["prev_time"] = [np.nan] + df.iloc[:-1]["#time"].tolist()
df["time_delta"] = df.time - df.prev_time
df
pd.set_option('display.height', 1000)
pd.set_option('display.max_rows', 1000)
pd.set_option('display.max_columns', 500)
pd.set_option('display.width', 1000)
dataframe.plot(x='#time', y='time_delta', style='r')
print dataframe
show()
更新我的代碼,我也是共享的.dat文件我的工作。執行涉及來自不同行的值的操作 https://www.dropbox.com/s/w4jbxmln9e83355/flash.dat?dl=0
大熊貓的轉換功能應該有所斬獲。 –