目前,谷歌助理SDK接受語音輸入,這意味着我的問題很簡單:我想與谷歌助手交談,但不使用語音,只是聊天。例如,這當然是,在Google Allo中。谷歌是否暴露了一個用於文本輸入的API?我們如何發送文字輸入到谷歌助手?
回答
它在v1alpha2
版本的谷歌助理SDK服務
SDK沒有文本選項。也許在將來。
你應該用_references_或_proof_ –
所以它看起來不像sdk接受文本,但它確實接受音頻文件輸入。它甚至可以作爲音頻文件輸出。
python -m pushtotalk -i somefile.wav -o outputfile.wav
這讓我開始思考,我寫了一個腳本:
echo $1 >> query.txt
espeak -f query.txt -w audio_query.wav
python -m pushtotalk -i audio_query.wav -o audio_response.wav &> pushtotalk.log
pocketsphinx_continuous -infile audio_response.wav 2> pocketsphinx.log > response.txt
cat response.txt
rm response.txt query.txt audio_query.wav audio_response.wav pocketsphinx.log pushtotalk.log
這僅僅是一個shell腳本,但是這可能會被轉換到Python了。要使用它,請將腳本保存爲pushtotalk_script.sh
並運行./pushtotalk_script.sh "how tall is mount kilamanjaro?
。我使用espeak將文本轉換爲wav文件。然後使用助理sdk得到迴應。你可以在這裏停下來播放回應。 Pocketsphinx是由CMU創建的音頻轉錄引擎。您可以使用apt-get找到這些工具的軟件包,但是如果您使用的是OSX,則pocketsphinx軟件包不起作用,您需要點擊這些formulas。另外,這裏有一個使用espeak的python module。還有一個pocketsphinx作爲python模塊的repo,但我不能鏈接兩個以上的鏈接。
谷歌的助理似乎沒有太多的麻煩理解espeak的輸出。然而,Pocketsphinx通常會在轉錄文本時遇到一些麻煩。但是對於簡單的迴應它很有效。根據問題的長度和響應音頻文件,整個過程大約需要5到10秒。
來支持你的答案還記得給腳本權限來使用'''chmod'''運行 –
這感覺不雅 - 我不知道,即使我想綜合演講。 –
- 1. 我們可以發送值到iframe中的輸入字段嗎
- 2. 如何在谷歌助手應用程序中發送多個語句?
- 3. 我們如何通過oauth api將消息發佈到谷歌?
- 4. 使用腳本而不是麥克風發送命令到谷歌助手
- 5. 谷歌分析關鍵字丟失?我如何找到他們?
- 6. 如何獲取谷歌身份驗證密碼到我們的應用程序,無需手動輸入
- 7. 使用谷歌助手SDK和原始文本作爲用戶輸入
- 8. 如何發送django崩潰報告到谷歌文檔
- 9. 如何把從谷歌地圖到輸入字段的座標?
- 10. 從谷歌眼鏡發送圖像到Android手機
- 11. 谷歌如何預測我們的話?
- 12. 我們如何修改谷歌標誌谷歌地圖
- 13. 如何手動觸發輸入文件?
- 14. 谷歌播放分發到手機只
- 15. android webview自動發送谷歌網站上的輸入密鑰
- 16. 如何使用谷歌+ api在C#.net中發送消息到谷歌環聊?
- 17. 如何發送輸入從Excel到Python?
- 18. 如何發送輸入到winlogon中c#
- 19. 如何發送輸入文本值
- 20. 互動與谷歌助手通過C#
- 21. 谷歌助手將無法啓動
- 22. 發送JSON數據到谷歌Plus
- 23. 發送用戶ID到谷歌分析
- 24. 發送邀請到谷歌日曆
- 25. 發送數據到谷歌分析
- 26. 谷歌圖表發送URI到ajax
- 27. 無法發送請求到谷歌
- 28. 使用python發送查詢到谷歌
- 29. 發送請求到谷歌融合表
- 30. 我想知道我們如何發送和接收Android手機上的文件?
現在支持它沒有可能的,但我建議你參加[討論](https://plus.google.com/101852559274654726533/posts/ BskrFscRYdh)的Google+社區。 – proppy