我有Maven依賴關係spark-sql_2.1.0
和spark-hive_2.1.0
。但是,當我嘗試import org.apache.spark.sql.DataFrame
時,出現錯誤。但是導入 org.apache.spark.sql.SQLContext
是可以的,沒有錯誤。爲什麼?爲什麼我不能導入org.apache.spark.sql.DataFrame
回答
DataFrame已成爲type DataFrame = Dataset[Row]
。 Java沒有類型別名,所以它在Java中不可用。現在,您應該使用新的類型Dataset<Row>
,所以導入這兩個org.apache.spark.sql.Dataset
和org.apache.spark.sql.Row
如果我有一個DataFrame,sqlContext.read(),我該怎麼辦? –
@JasonShu只是'數據集
@JasonShu你還應該在Spark 2.x中使用SparkSession: –
import org.apache.spark.sql.DataFrame
作品scala
而不是java
因爲沒有爲java
開發庫。您可以使用dataSet
作爲Spark SQL, DataFrames and Datasets Guide解釋
您可以導入以下
import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
,並把它們作爲
Dataset<Row> peopleDataFrame = spark.createDataFrame(rowRDD, schema);
或者
Dataset<Row> peopleDF = spark.createDataFrame(peopleRDD, Person.class);
或者
Dataset<Row> usersDF = spark.read().load("examples/src/main/resources/users.parquet");
這是真的。但是,如果我有一個DataFrame,例如,sqlContext.read()。我應該怎麼做? –
您可以使用'數據集
是的,它工作。但是,當涉及到sqlContext.read.json,它失敗了。 –
- 1. 爲什麼我不能導入geopandas?
- 2. 爲什麼我不能導入nltk?
- 3. 爲什麼我不能導入pygtk?
- 4. 爲什麼我不能導入android.os.StrictMode?
- 5. 爲什麼我不能導入tensorflow
- 6. 爲什麼我不能導入「models.User」?
- 7. 爲什麼我不能導入pg.py?
- 8. 爲什麼我不能導入java.util.concurrent.ConcurrentSkipListMap中
- 9. 爲什麼我不能導入sklearn
- 10. 爲什麼spyder不能導入tensorflow
- 11. 爲什麼不能導入文件?
- 12. 爲什麼我不能將我的C#類型導入IronPython?
- 13. 爲什麼我不能從導軌IFNULL
- 14. 爲什麼我不能下載導軌?
- 15. 爲什麼我不需要導入sys?
- 16. 爲什麼我不能淡入sencha touch?
- 17. 爲什麼我的SWF不能嵌入?
- 18. 爲什麼我不能插入?
- 19. 爲什麼我不能點擊輸入?
- 20. 爲什麼我不能在TypeScript中導入sprintf-js
- 21. 爲什麼我不能將現有項目導入到eclipse中?
- 22. 爲什麼我不能導入此哈斯克爾模塊?
- 23. 爲什麼我不能在Android Studio中導入java.util.function包?
- 24. 爲什麼我不能在Python 3.5中導入pptx包
- 25. 爲什麼我不能導入數據庫
- 26. 爲什麼我不能總是導入熊貓
- 27. 爲什麼我不能導入這個類?
- 28. 爲什麼我不能在@NgModule中導入Angular 2服務?
- 29. 爲什麼我不能在Grails中導入這個Groovy庫?
- 30. 爲什麼我不能導入UITableViewCell子類?這是奇怪的
你正在得到什麼類型的錯誤?這對我來說工作得很好 –
你使用哪種語言? –
@T.Gawęda我正在使用Java –