2016-03-09 53 views
0

我目前有嵌入更大的計算優化DASK系列過濾 - 懶惰版本Series.isin的()

seq1.isin(seq2[seq3].unique().compute().values) 

其中seq3是布爾系列內的以下的圖案。 性能似乎可以接受,但它很醜,使用compute()強制評估,可能會消除並行機會。 簡單地說

seq1.isin(SEQ2 [SEQ3] .unique())

不工作,文檔說,參數isin必須是(我相信NumPy的)陣列。

有沒有更好的方法來編寫上面的代碼? 如果seq1seq2是一樣的呢?

回答

0

我不認爲有可能做一個增量集合的成員資格操作。爲了獲得正確的結果,您需要有一個完全實現的集合來回答項目是否是其成員的問題。

0

您可能可以使用內部聯接來實現此操作。