sound-recognition

    -3熱度

    1回答

    我想知道是否可以使用Windows Azure認知服務創建服務,以使我能夠識別對話中的一個特定聲音(由互聯網上的直播流提供)以及如何製作它。 我已經知道機器學習的基本技術,但我從來沒有實現過這樣的東西,無論如何,我想使用認知服務使它成爲一種簡單而有效的方式。 該任務將與其他任務(如事件鏈)相關聯,所以我應該使用爲Java或Python提供SKD的東西。 有人知道我該怎麼做? 謝謝!

    4熱度

    1回答

    我對shazam或soundhound如何工作感興趣。 它如何記錄語音並使指紋與指紋數據庫相似? 我即將開始在C/C++中編寫一些軟件,但不確定要使用哪個庫,看到有一些來自Microsoft的Speech SDK。你有沒有建議,從哪裏開始'理解'分析語音和玩它的過程? 我會很感謝每一個提示或想法,你會分享:]

    0熱度

    2回答

    我想要構建一個應用程序,以響應您吹熄生日蠟燭時所發出的聲音。這本身不是語音識別(這個聲音不是英語中的單詞),而且OpenEars上非常善良的Halle告訴我,使用該框架是不可能的。 (感謝您的快速響應,哈雷!) 有沒有辦法「教」一個應用程序的聲音,使應用程序可以隨後識別它? 我該怎麼辦?它是否可行?我是瘋了還是承擔比我想象的要困難得多的問題?我的作業應該是什麼?

    1熱度

    1回答

    我嘗試在我的android應用程序中創建一個尖叫和哨子檢測器。現在我可以通過使用musicg android庫here來檢測用戶的哨聲。我必須自己實施尖叫探測器,因爲沒有可用的庫。 在musicg中,它讀取音頻數據並將其存儲在字節緩衝區中。它使用緩衝區作爲其哨子檢測器的輸入。我試圖通過在LogCat中打印這些字節來了解和了解這些字節的樣子。但是,我不知道它們是什麼以及音樂庫如何使用此輸入來檢測用戶

    1熱度

    1回答

    ,我發現了一個有趣的寶石從它來自返回標題和藝術家,其音樂的未知文件發現:https://github.com/tenderlove/earworm 事實就是最後一次提交是4年前,並使用的網站已不再工作... 有誰知道這個問題的另一種解決方案?另一個寶石或其他片段?

    1熱度

    1回答

    有誰知道某些軟件(例如SmartMusic或Garageband)能夠「聽」演奏者正在播放的音樂,檢測播放的錯誤音符並提供總分嗎?例如88%? 是否有任何API可用於創建應用程序,可以使用各種標準(如音調,節奏,音量和/或音調)對演奏者現場演奏的音樂短語/片段進行評分/評級? 感謝大家的想法。

    0熱度

    1回答

    有一些模型可以識別2類聲音,它們是A類和B類。 如何將C類聲音識別爲異常聲音? 我試圖設置一個閾值,同時通過幀進行識別。 above 70% -> class A or B else -> abnormal 例如, 如果聲音具有10幀,其結果是 frame 1 2 3 4 5 6 7 8 9 10 A B A B A A A B A A A=7 B=3 -> class A

    1熱度

    1回答

    我正在構建一個網頁,我需要在麥克風捕捉特定聲音時執行某些操作。我搜索了很多,發現此鏈接: Write a Program Which Recognizes a Sound and Performs Action 我被困在兩兩件事: 如何使用基於Java的聲音識別雖然網頁或 的JavaScript 如何搭配使用任何識別器的兩個聲音(一個來自麥克風和其他來自保存的文件) 對於聲音識別器,使用Sphin

    1熱度

    1回答

    我想提高我的知識和工作與聲音重組(語音到文本)。我從谷歌找到好的樣本,但我不知道我怎麼能用波斯語 - 波斯語來做這些事情?我用英語來做,但波斯語怎麼樣?是否需要在我的手機安卓手機中進行一些設置?有誰這樣做? Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); intent.putExtra(Recognize

    0熱度

    1回答

    我正在尋找一種算法,通過它們的語音來比較兩個聲音文件。我想評估某種評分(例如0:沒有相似性; 100:相同的聲音)。因此,我在Audacity中加載了一臺計算機生成的錄音和錄製的人聲,並說出「你好」的聲音(我知道,這不是專業的...),並看着海浪。 https://dl.dropbox.com/s/p8o8tpsayo9xr14/hello.png(不幸的是,我不能插入圖片) 雖然這兩種聲音com