您創建一個數據幀後,讀一卡桑德拉DB和獲取列表在destinationip字段中,您可以像這樣查詢
val spark =
SparkSession.builder().master("local").appName("test").getOrCreate()
import spark.implicits._
val data = spark.sparkContext.parallelize(Seq(
(123, Array("10.100.1.25", "10.100.164.36"), "10.100.164.32"),
(456, Array("10.100.1.25", "10.100.164.3"), "10.100.164.32"),
(45, Array("10.100.1.25", "10.100.164.36"), "10.100.164.32"),
(46, Array("10.100.1.25", "10.100.164.367"), "10.100.164.32")
)).toDF("current_time","destinationips", "source_ip")
data.select("*").where(array_contains(data("destinationips"), "10.100.164.36")).show
有什麼喲你試過了嗎?您的預期輸出也與您分享的數據不一致。 – mtoto
您只對'destinationips'感興趣嗎? –