2015-06-17 35 views
0

我創建與屬性日期.arff文件:Weka的屬性日期不工作

@attribute數據日期 「YYYY-MM-DD」

與其他屬性。數據的

一個例子是:

@data

「2014年1月2日」,11.27,11.44,11.03,11.18,11.07,11.07,11.12,9419,2003400,2240946600, 1

但是,Weka似乎無法識別日期屬性。這是因爲當我查看圖形(來自日期屬性)時,軸x(它將對應於日期)的邊距從1388628000000開始,並在1419904800000結束,這根本沒有意義。

當我嘗試分類時,分類器(我用J48樹和SVM測試)只需要一個類和整個測試集的推崇。顯然是錯的,我相信這是因爲日期屬性。

任何想法,我該如何解決這個問題?

回答

1

通過一些研究,我獨立發現了一些與你的問題有關的東西。看看它是否對你有幫助。

https://stackoverflow.com/questions/32738822/weka-doesnt-differentiate-between-date-and-numeric-attributes-features

最嚴重的問題是,一些Weka的算法(超過期望的)不承認日起,所有的屬性。

編輯:

當比較型日期VS數字的兩個屬性,Weka中不區分它們,即,日期屬性返回其類型爲數字,因此,它們具有重合類型時這不應該是正確的答案。如果您檢查日期屬性,那麼Weka會將日期視爲某種目的,但在內部,Weka會將日期視爲一個數字(如果我是正確的,則以參考日期爲單位)。問題是,從用戶的角度來看,它不是同一類型的屬性,應該指出。

我一直在考慮將日期轉換爲數字(可能通過過濾器),但日期固有的信息功能將是沒有意義的。

另一種方法涉及將日期屬性轉換爲幾個數字+名義屬性,如:年,月,日,星期,星期幾。

+0

儘管此鏈接可能會回答問題,但最好在此處包含答案的基本部分,並提供供參考的鏈接。如果鏈接頁面更改,則僅鏈接答案可能會失效。 – Rob

+0

對!它已被編輯。 – shirowww