2017-10-06 161 views

回答

1

對於主庫(array,bag,delayed,dataframe)中的任何dask集合,是的,相同的名稱應該意味着相同的值。

然而,相反並不總是如此。我們不使用確定性哈希處處。有時我們會使用uuid。例如,隨機數組總是得到隨機的密鑰UUID,但兩個隨機數組可能偶然相等。

對於在Dask庫之外創建的集合不提供任何保證。在調度程序級別沒有執行任何操作。

+0

哈希碰撞的好處(關於隨機數組)。 – jakirkham

+0

要明確我的意思是價值平等,即使鑰匙是不同的。人們可以通過各種方式來到同一組數字。散列由路徑定義,而不是最終結果。 – MRocklin