2016-04-22 50 views
0

我試圖用三種不同的傳感器數據進行預測。每個傳感器都具有周期性,並且測量時刻不相同(例如sensor1data_time = 10:01; sensor2data_timestamp = 10:03; sensor3data_timestamp = 10:05)。RapidMiner TimeStamp預處理

我爲演示手動完成了這項任務,但現在我需要自動完成此任務以開發預測模型。

推薦任何預處理任務?

在此先感謝

回答

2

我會圍繞時間到最近的十分鐘。要使用的運營商是Generate Attributes。我傾向於使用自01-01-1970以來的秒數。以下片段顯示您可以使用的功能。我假設你有一個名爲datestr的屬性,它包含這種格式的日期13-01-2016 23:01:01。

attribute name function expression  
------------------------------------------------------------------- 
date    date_parse_custom(datestr, "dd-MM-yyyy HH:mm:ss") 
epochdate   date_diff(date_parse(0), date)/1000 
dateToTenMins  600*round(epochdate/600) 

時代日期以毫秒爲單位,因此除以1000會得到秒數。

+0

我明白你的意思了。感謝您的幫助。但是,如果有多個值輪迴到相同的時間戳,我可以使用'FilterExamples'操作符來刪除重複的值嗎? – Havor

+0

您可以使用'Aggregate'運算符來統計具有相同時間戳的示例數量。你會期望從每個傳感器的每個時間戳看到1。 – awchisholm

+0

真的有用你的意見:)再多一個問題。我不明白你爲什麼使用'600'。我的意思是,如果不是四捨五入到最接近的五分鐘,以防我想繞到較低的小時?例如,如果1:03和1:53我想爲他們兩個獲得1點??我怎麼能這樣做? – Havor