2016-12-24 47 views
0

我有一些時間序列數據集,我想要轉換爲dft信號以降低維度。在轉換爲dft後,我想使用k-means算法對得到的dft數據集進行聚類。時間序列DFT信號聚類

由於dft信號包含一個虛數如何聚簇它們呢?

回答

0

您可以簡單地將虛部作爲向量中的另一個組件。在其他應用程序中,您將會忽略它!

但是,您將面臨其他更嚴峻的挑戰。

數據挖掘,尤其是聚類很少像應用函數a(dft)和函數b(k-means)那樣簡單,然後得到結果,即萬歲。對不起 - 這不是探索式數據挖掘的工作原理。

首先,對於許多時間序列,DFT根本沒有幫助。在其他人中,您首先必須做適當的重採樣或細分,或者去除季節性等無趣效果。即使DFT起作用,它也可能強調諸如採樣頻率或某些干擾之類的僞像。

然後你會遇到一個主要問題:k-means基於所有屬性具有相同重要性的假設。而DFT基於非常相反的想法:第一個組件捕獲大部分信號,後面的組件只有很小的偏差(並且這是將其用作降維的動機)。因此,基於這種直覺,你可能永遠不會根據DFT係數完全應用k均值。同時,數據挖掘一再表明,「統計無稽之談」的工作可以提供有用的結果......所以你可以嘗試,但要小心地核實結果,避免過於熱情或樂觀。

+0

我的研究目標是按照它們執行數據挖掘任務(如聚類和分類)的能力,對不同的時間序列降維技術進行基準測試。 – user1143110

+0

我一定會按照你的指導進行DFT技術。 – user1143110

0

在FFT的幫助下,它將數據集轉換爲dft信號。它有助於計算每個小數據集的DFT。