在一些數據上,我計算意味着列式。Python熊貓:重用存儲意味着要正確替換nan
比方說數據看起來像這樣
A B C ... Z
0.1 0.2 0.15 ... 0.17
. . . .
. . . .
. . . .
我用數據框的平均值()函數,併爲結果我
A some_mean_A
B some_mean_B
...
Z some_mean_Z
對於更換的NaN,我用fillna()。它適用於計算均值並在同一執行過程中使用它的情況。
但是,只要我將文件保存在一個文件中並閱讀它以便在不同的.py文件中使用它,我就會變成垃圾。原因是手段文件解釋不正確。在新的數據集中,列A的每個NaN應該被some_mean_A替換。同爲B和休息,直到Z.但是,這是不會發生的,因爲通過讀取read_csv)的手段(我得到以下
0 1
A some_mean_A
B some_mean_B
...
Z some_mean_Z
當我使用這個與fillna(),我沒有得到預期結果。
所以,我希望你能理解我的問題。你知道如何解決這個問題嗎?
編輯1.0:
我這是怎麼計算和存儲手段:
df_mean = df.mean()
df.fillna(df_mean, inplace=True) // df is the dataframe for dataset where it works
df_mean.to_csv('mean.csv')
這是我讀的手段:
df_mean = pd.read_csv('mean.csv', header=None)
您可以包括你如何保存和加載手段載體?這可能是一個索引問題。 – ayhan
我加了均值向量的保存和讀數。 – tumbler