我目前有嵌入更大的計算優化DASK系列過濾 - 懶惰版本Series.isin的()
seq1.isin(seq2[seq3].unique().compute().values)
其中seq3
是布爾系列內的以下的圖案。 性能似乎可以接受,但它很醜,使用compute()
強制評估,可能會消除並行機會。 簡單地說
seq1.isin(SEQ2 [SEQ3] .unique())
不工作,文檔說,參數isin
必須是(我相信NumPy的)陣列。
有沒有更好的方法來編寫上面的代碼? 如果seq1
和seq2
是一樣的呢?