0
在ES集羣,它有一個大規模的數據,我們使用的火花計算數據,但在elasticsearch-hadoop
的方式,其次是https://www.elastic.co/guide/en/elasticsearch/hadoop/current/spark.html如何通過spark讀取幾列elasticsearch?
我們去閱讀一個索引的全列。有什麼幫助嗎?
在ES集羣,它有一個大規模的數據,我們使用的火花計算數據,但在elasticsearch-hadoop
的方式,其次是https://www.elastic.co/guide/en/elasticsearch/hadoop/current/spark.html如何通過spark讀取幾列elasticsearch?
我們去閱讀一個索引的全列。有什麼幫助嗎?
是的,您可以分別設置配置參數「es.read.field.include」或「es.read.field.exclude」。全部細節here。假設Spark 2或更高版本的示例。
val sparkSession:SparkSession = SparkSession
.builder()
.appName("jobName")
.config("es.nodes", "elastichostc1n1.example.com")
.config("es.read.field.include", "foo,bar")
.getOrCreate()
非常感謝,它的工作! – user7956505