我正在嘗試使用jupyter筆記本(運行Pyspark)創建一個簡單的df(數據框),並且我不斷收到一條長長的錯誤消息,該網頁上的ML示例(IndexToString):http://spark.apache.org/docs/latest/ml-features.html#onehotencoder。其中一行說:Apache pyspark ML示例不能正常工作
Py4JJavaError: An error occurred while calling o23.applySchemaToPythonRDD. : java.lang.RuntimeException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient
請幫忙,這是否意味着我需要有一個RDD首先建立一個DataFrame?另外,我嘗試了MLlib方法,它工作得很好,這是ML方法不斷給我錯誤。
我用的是星火2.0 0.0 – jypucca