我使用Spark 2.1和Cassandra(3.9)作爲數據源。 C *有一個有50列的大表,對我的用例來說這不是一個好的數據模型。所以我爲每個傳感器創建了拆分表以及分區鍵和集羣鍵列。 All sensor table
-----------------------------------------------------
| Device | Time | Sensor1 | Sens
我需要實施星火下面的SQL邏輯DataFrame SELECT KEY,
CASE WHEN tc in ('a','b') THEN 'Y'
WHEN tc in ('a') AND amt > 0 THEN 'N'
ELSE NULL END REASON,
FROM dataset1;
我輸入DataFrame是如下: val dataset1 = S