下面是我的腳本在數據幀使用SQL與Python:註冊臨時表不工作
pyspark --packages com.databricks:spark-csv_2.10:1.4.0
from pyspark.sql import SQLContext
sqlContext = SQLContext(sc)
df = sqlContext.read.format('com.databricks.spark.csv').options(header='true', inferschema='true').load('file:///root/Downloads/data/flight201601short.csv')
df.show(5) 結果顯示的如下:
然後我將數據幀註冊到臨時表中:
df.registerTempTable("flight201601")
想跑一些SQL查詢象下面這樣:
sqlContext.sql("select distinct CARRIER from flight201601")
它不會產生預期的結果,而不是:
我也試過:
sqlContext.sql("select * from flight201601")
,它給我:
所以它似乎registerTempTable方法只創建表架構和表不填充,我錯過了什麼?