1
我正在將多個操作應用於dask數據框。我可以爲特定操作定義分佈式工作人員資源需求嗎爲數據幀操作定義dask工作者資源
例如我打電話是這樣的:
df.fillna(value="").map_partitions(...).map(...)
我想指定map_partitions資源需求()(比那些潛在的不同的地圖()),但好像方法不接受資源參數。
PS。或者,我發現我可以在map_partitions()之後調用client.persist()並在此調用中指定資源,但是這會立即觸發計算。