1
確定兩個Dask對象是否引用相同結果的正確方法是什麼?這與比較兩者的name
屬性一樣簡單還是需要運行其他檢查嗎?檢查兩個Dask是否相同
確定兩個Dask對象是否引用相同結果的正確方法是什麼?這與比較兩者的name
屬性一樣簡單還是需要運行其他檢查嗎?檢查兩個Dask是否相同
對於主庫(array,bag,delayed,dataframe)中的任何dask集合,是的,相同的名稱應該意味着相同的值。
然而,相反並不總是如此。我們不使用確定性哈希處處。有時我們會使用uuid。例如,隨機數組總是得到隨機的密鑰UUID,但兩個隨機數組可能偶然相等。
對於在Dask庫之外創建的集合不提供任何保證。在調度程序級別沒有執行任何操作。
哈希碰撞的好處(關於隨機數組)。 – jakirkham
要明確我的意思是價值平等,即使鑰匙是不同的。人們可以通過各種方式來到同一組數字。散列由路徑定義,而不是最終結果。 – MRocklin