2016-10-19 78 views
-1

我在我的java spark應用程序中添加了使用DataFrame的maven依賴項。據我所知的依賴應該在pom.xml中按以下格式註明:Spark sql DataFrame類不存在

<dependency> 
<groupId>org.apache.spark</groupId> 
<artifactId>spark-sql_2.10</artifactId> 
<version>1.2.0</version> 
</dependency> 

但是,當我想導入org.apache.spark.sql.DataFrame我的代碼,數據幀類是未知的!任何想法爲什麼會發生?

回答

1

我認爲你的版本是錯誤的。這些代碼添加到您的pom.xml

<!-- https://mvnrepository.com/artifact/org.apache.spark/spark-core_2.10 --> 
    <dependency> 
     <groupId>org.apache.spark</groupId> 
     <artifactId>spark-core_2.10</artifactId> 
     <version>1.6.2</version> 
     <scope>provided</scope> 
    </dependency> 
    <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-sql_2.10 --> 
    <dependency> 
     <groupId>org.apache.spark</groupId> 
     <artifactId>spark-sql_2.10</artifactId> 
     <version>1.6.2</version> 
     <scope>provided</scope> 
    </dependency> 

和進口如下。

import org.apache.spark.sql.DataFrame; 
0

Spark在星火1.3版本中引入Dataframes。

你的火花版本是1.2.0 ,要訪問dataframe API使用火花版本> = 1.3.0

如果你是usind Datasets也使用火花版本> = 1.6.0

火花1.6,引入數據集API

相關問題