在我的數據框中,我將最終得到一個只有少數非nan值的列。我想使用非nan值作爲包含NaN值的所有前面的行的分組變量。爲了模擬它,我做了如下排列:用後續值填充數組
count = np.array([np.NaN,np.NaN,np.NaN,3,np.NaN,np.NaN,6,np.NaN,np.NaN,np.NaN,np.NaN,np.NaN,12])
count = Series(count)
對於這陣我能創造一個填充功能
def pad_expsamp_time(array):
sect = np.zeros(array.size) # create array filled with zeros
inds = array.index[array.notnull()] # select the non-zero values
rev_inds = inds[::-1] # sort high to low
# fill array with value until index of value. Repeat for lower values.
for i in rev_inds:
sect[:i] = i
return Series(sect)
此功能,當它可以假設非的索引nan值等於實際值。但是,如何在索引不等於內容時填充數組?
例如,如果陣列計數是什麼:
count = np.array([np.NaN,np.NaN,np.NaN,1,np.NaN,np.NaN,2,np.NaN,np.NaN,np.NaN,np.NaN,np.NaN,3])
和期望的輸出是
count = np.array([1,1,1,1,2,2,2,3,3,3,3,3,3]
可能的是,有在陣列的端部的NaN。我希望這些留下NaN,這樣數據框就會忽略它們。
count = np.array([np.NaN,np.NaN,np.NaN,1,np.NaN,np.NaN,2,np.NaN,np.NaN,3,np.NaN,np.NaN])
# Will become:
count = np.array([1,1,1,1,2,2,2,3,3,3,np.nan,np.nan]
請問最後一個元素是'NaN'? – Divakar
@Divakar是的,它確實可以 –
那麼,你需要它來填充東西嗎?如果是這樣,我們應該填寫什麼?添加一個案例可能? – Divakar