我正在將xarrays分割成機器學習過程的小數據塊,並且試圖過濾掉其中沒有數據值的多維數據集。檢查python xarray數據集中是否存在值
我想保持內存佔用小,並已分配一個不可能的值爲-999到無數據值。這樣做是爲了讓事情int16
,而不需要爲nan
問題更大的類型:什麼是檢查是否存在在xarray.Dataset -999的最佳方式?
以下是我有:
(dataset == -999).any()
將一代產量:
<xarray.Dataset>
Dimensions: ()
Data variables:
var_a bool True
var_b bool True
var_c bool False
之後
我很可能要選擇類似var_a
。我的代碼最終會這樣看:
def is_clean(dataset):
return (dataset == -999).any().var_a is True
也許我還記憶猶新,當談到Xarrays,但我不能找到一個更好的方式在文檔中做到這一點。關於xarrays,我缺少什麼樣的結構化知識,使我無法與當前的解決方案保持一致?任何提示?
'return(dataset.var_a == -999).any()'? –
感謝您的回覆。我的問題是'return(dataset.var_a == -999).any()'將返回一個不是布爾值的'xr.Dataset'。 – Conic
返回的「xr.Dataset」的維度是什麼? –