我有包含每日記錄的配置單表。我想從工作日中選擇記錄。所以我使用bellow蜂巢查詢來做到這一點。我正在使用QUBOLE API來執行此操作。 SELECT hour(pickup_time),
COUNT(passengerid)
FROM home_pickup
WHERE CAST(date_format(pickup_time, 'u') as INT) NOT IN
我從s3文件獲得以下DataFrame輸入,並需要將數據轉換爲以下所需的輸出。我在Scala中使用了Spark 1.5.1版本,但可以使用Python更改爲Spark。歡迎任何建議。 數據框中輸入: name animal data
john mouse aaaaa
bob mouse bbbbb
bob mouse ccccc
bob dog ddddd
所需的輸出: joh