我試過搜索了一下,但是在Spark SQL中只能找到add_month函數,所以最後在這裏打開了一個新的線程。將不勝感激任何人可以提供的幫助。在Spark中添加12小時到datetime列
我想在使用sqlContext的Spark SQL的日期列中添加小時12,24和48。我使用的1.6.1版本星火,我需要這樣的:
SELECT N1.subject_id, '12-HOUR' AS notes_period, N1.chartdate_start, N2.chartdate, N2.text
FROM NOTEEVENTS N2,
(SELECT subject_id, MIN(chartdate) chartdate_start
FROM NOTEEVENTS
WHERE subject_id = 283
AND category != 'Discharge summary'
GROUP BY subject_id) N1
WHERE N2.subject_id = N1.subject_id
and n2.chartdate < n1.chartdate_start + interval '1 hour' * 12
請注意最後一句話,這是寫在PostgreSQL,而這也正是我需要星火SQL。我非常感謝我能得到的任何幫助。
謝謝。
@Ahsan大:)如果你將有性能問題,再看看安東Okolnychyi答案 - 本地功能有可能是推下去。但在這種情況下,我認爲不可能推下謂詞,因爲它在少數表格上運行,所以UDF應該沒問題且更易於閱讀。 –