2011-11-26 60 views
3

我想使用基於模型的聚類來分類1,225個時間序列(每個時間段有24個時間段)。我已經使用快速傅立葉變換對這些時間序列進行了分解,並選擇瞭解釋樣本中所有時間序列的至少時間序列方差閾值百分比的諧波。我希望對給定時間序列的每個變換元素的實部和虛部進行基於模型的聚類,因爲它可能使我無需考慮時間序列中不同時期的模型awed聚類中的時間自相關。我知道快速傅立葉變換的每個複數元素都獨立於其他元素,但我不知道給定輸出元素的輸出的虛部和實部是否是獨立的。我想知道,因爲如果他們是這樣的話,它將允許我保持R中Mclust軟件包對基於模型的聚類的默認假設,即所分析的變量具有多變量高斯分佈。fft輸出的實部和虛部是否相關?

注意:完整的FFT沒有被使用,因爲我已經放棄了負頻率的元素,並且通過將頻率1乘以奈奎斯特兩倍的指數,從而將其從雙側頻譜轉換爲單側頻譜:How do I calculate amplitude and phase angle of fft() output from real-valued input?

回答

6

的實部和虛部是正交(由於的sin(x)和正交餘弦(x)的函數)。這個特性對FFT的工作原理非常重要。

Wolfram MathWorld

傅立葉級數是一個周期函數的在 的正弦和餘弦的無限和項的擴大。傅里葉級數利用正弦函數和餘弦函數的正交關係 。

的FFT本質上是基礎的改變。這並沒有說明數據本身可能包含或不包含真實和虛擬部分之間的相關性。

關於編輯的問題,「我怎樣計算振幅和FFT的相位角(°)從實值輸入輸出?」。將實分量和虛分量轉換爲幅度和相位角的方法是magnitude = (real_part ** 2 + imaginary_part ** 2) ** 0.5angle=arctan2(imaginary_part, real_part)。它與rectangular-to-polar conversion相同。

+1

很好的回答 - 我想補充的是,雖然是集羣更容易成功/有意義的相位/幅度,而不是真正的/虛部 –

+0

但相位和幅度必須依賴於彼此,因爲它們的功能真實的和想象的部分? Aftr聚類可以直接計算它們 –

+4

這個問題似乎將「獨立」(在統計分佈意義上)與「正交」(在函數空間意義上)相混淆。因此,答案提出了一個數學上正確但無關緊要的陳述,並按照所述的方式得出了對問題的不正確答案,正如http://stats.stackexchange.com/questions/18969/arereal中的交叉帖子中的評論所解釋的那樣。 -and-虛分量-的頻元素的-FFT的相關。然而,事實證明,在這個問題中,完整的FFT沒有被使用(儘管這沒有被公開)。 – whuber