2014-03-18 40 views
0

請原諒我的問題,因爲有點太寬泛。音頻數據的健身功能

我想對分組類似的音樂一起利用遺傳算法的工作。我似乎無法找到如何檢查我的解決方案的確切方式,我想知道社區對此有何評論。

我的一個朋友說的kNN算法可能是有幫助的;如果是的話,那麼如何? 其他建議?

+0

你可能需要能描述一下你會考慮「相似」你可以問我們的算法之前,來衡量它。 – AShelly

+0

對不起。我還不確定自己的功能。我打算考慮每分鐘節拍(BPM)和歌曲的流派。也許我可以通過對音頻信號進行更詳細的分析來提取更豐富的特徵。 – Ali

回答

1

所以,我認爲這是通常做的方式是有一些音樂專家(也許是音樂博客或從事音樂經典訓練)做自己的音樂排行榜,然後你可以用它來測試反對。沒有某種測試集,很難「證明」兩首歌曲之間的相似性。但是,這些測試集中的任何一個都會具有內在的主觀性,所以我可以看到,即使您可以找到其中一個數據集,也會遇到一些問題。

我看着其他人都在使用在學術界是什麼,顯然有每年由美國伊利諾伊大學香檳分校的MIREX評價活動的大學的國際音樂信息檢索系統評價實驗室頭駐紮創建一個大library 。他們根據這些數據在這次活動中進行了一系列比賽,其中包括一些用於音樂相似性和分類的比賽。然後將結果發佈在International Society for Music Information Retrieval的年度會議上。

最後一件事,你可以看看(如果你還沒有的話)是Music Genome Project潘多拉使用作爲後端。他們讓音樂家爲每首歌添加標籤,但我認爲他們的排名使用這些標籤作爲特徵,而不是某種分析方法,比如比較旋律,低音,人聲等實際統計數據。

因此,總結,在我冗長的回答之後,它取決於你的特徵空間是什麼,但假設你將比較你的「染色體」之間的分類分數,你應該能夠使用k-最近的鄰居爲你的健身。然而,找到一個好的數據集並找出你的特徵空間使用什麼指標(即歐幾里得,皮爾森等)是很困難的。請參閱第2節中的this paper,作爲如何執行此操作的示例。