如何通過spark讀取幾列elasticsearch？

在ES集羣，它有一個大規模的數據，我們使用的火花計算數據，但在elasticsearch-hadoop的方式，其次是https://www.elastic.co/guide/en/elasticsearch/hadoop/current/spark.html 如何通過spark讀取幾列elasticsearch？

我們去閱讀一個索引的全列。有什麼幫助嗎？

來源

2017-05-04 user7956505

是的，您可以分別設置配置參數「es.read.field.include」或「es.read.field.exclude」。全部細節here。假設Spark 2或更高版本的示例。

val sparkSession:SparkSession = SparkSession 
    .builder() 
    .appName("jobName") 
    .config("es.nodes", "elastichostc1n1.example.com") 
    .config("es.read.field.include", "foo,bar") 
    .getOrCreate()

來源

2017-05-04 03:14:30

非常感謝，它的工作！ – user7956505

如何通過spark讀取幾列elasticsearch？

回答

相關問題