2
在DASK是什麼DASK df.col.unique()與df.col.drop_duplicates()
df.col.unique()
和
df.col.drop_duplicates()
之間的差都返回包含的獨特元素的一系列df.col
。 該指數有差異,unique
結果索引1..N而drop_duplicates
索引任意查找數字序列。
drop_duplicates
返回的索引有什麼意義?
如果索引不重要,是否有任何理由使用另一個?
一個原因使用'unique'是,它返回一個'numpy.ndarray'而不是熊貓系列。 – Featherlegs