任何人都可以向我解釋爲什麼我對這兩個表達式得到不同的結果嗎?我想2日期間進行過濾:數據幀上的多個條件篩選器
df.filter("act_date <='2017-04-01'" and "act_date >='2016-10-01'")\
.select("col1","col2").distinct().count()
結果:37M
VS
df.filter("act_date <='2017-04-01'").filter("act_date >='2016-10-01'")\
.select("col1","col2").distinct().count()
結果:25M
他們如何不同?在我看來,像他們應該產生相同的結果
謝謝,我應該使用上面描述的單個SQL字符串。我的一個疏忽。 – femibyte