1
JSON格式是這樣的:PySpark - 如何輸出特定字段的JSON?
{
"name": "aaa",
"address": {
"street": "blv abc",
"street_num": "122"
}
}
我會讀從地板文件中的數據並對其執行一個SQL查詢,比如尋找所有住在街道blv abc
那些。但我只是想輸出name
和address.street
爲:
{
"name": "aaa",
"address": {
"street": "blv abc"
}
}
我怎麼能只輸出name
和address.street
?
DataFrameReader模式可能不適用於我,因爲我需要在輸出之前執行一些SQL查詢,可能需要在street_num
上進行過濾。
你到底想幹什麼?將JSON轉換爲不帶street_num的新JSON?你能否提供你的代碼,顯示你想要做什麼? – Yaron
'record = sqlContext.read.parquet(「file.json」)' 'sqlContext.registerDataFrameAsTable(record,「record」)' 'sqlContext.sql(「select * from record where street =='blv abc'」 )' – ryan