我有這個數據框,「數據」,包含大約每半小時收集一整年的數據,但有些日子只收集了幾小時的數據。如何計算每小時在R中收集的天氣變量數據的日平均值,中位數?
日期的格式爲:31.01.2010 00:30
(都在同一個小區) 變量是:Temperature
,humidity
,PM10
,windspeed
等
第一個問題:我如何計算每天的手段,中位數,最大值,最小值,這些變量的值,因此我可以在進一步的分析中進行測試,例如使用GAM進行生存分析),而不是每小時/每半小時的數據?
顯然,計算出日平均/中位數應該被分配到相應的日期。
第二個問題:DATES
列同時包含日期和時間,在同一個單元格中由一個空格分隔。 在R,它的類型是'Factor'
,我不能做任何計算,因爲錯誤"dates" is missing
出現。
我的猜測是,我需要先將它從Factor
轉換爲date/time
,這樣才能識別它,然後計算均值/中值。但我該怎麼做?
你能請註明這將是自變量/函數使用?
我認爲我已經解決了從'Factor'到POSIXlt的日期轉換:我使用了函數strptime(Data $ DATES,format =「%d。%m。%Y%H:%M」)和現在$日期是公認POSIXlt,格式爲「2010-01-01 00:00:00」 ......
但我仍然需要找到一個計算日平均或平均數或中位數或任何功能。
我認爲我已經解決了日期從「要素」來POSIXlt轉換:我使用的功能strptime(Data $ DATES,format =「%d。%m。%Y%H:%M」),現在$ DATES被識別爲POSIXlt格式「2010-01-01 00:00:00」.... –
刪除了'生存分析'和'gam'標記,因爲它們都不適用於這個問題。 –