2017-05-18 104 views
2

我試圖使用Google Cloud Speech API將一小時以上的音頻數據轉換爲文本,並且我使用API​​ Explorer,因爲它很容易。Google Cloud Speech API longrunningrecognize only returns name

請求看起來像這樣。

POST https://speech.googleapis.com/v1/speech:longrunningrecognize?key={YOUR_API_KEY} 
{ 
    "audio": { 
    "uri": "gs://data/audio.flac" 
    }, 
    "config": { 
    "encoding": "FLAC", 
    "languageCode": "en-US" 
    } 
} 

答案是這樣的。

200 
Show headers 
{ 
    "name": "`numbers`" 
} 

這是怎麼回事,而不是返回音頻的文本?

回答

3

剛剛有同樣的問題。

找到了答案上https://cloud.google.com/speech/docs/async-recognize

如果請求成功,服務器會返回200 OK HTTP狀態代碼以及JSON格式的響應:

{ 
    "name": "5543203840552489181" 
} 

其中name是爲請求創建的長時間運行操作的名稱。 等待大約30秒鐘以完成處理。要檢索操作的結果,做一個GET請求:

GET https://speech.googleapis.com/v1/operations/YOUR_OPERATION_NAME?key=YOUR_API_KEY 

得到了我的結果與:

curl -s -k -H "Content-Type: application/json" \ 
    -H "Authorization: Bearer {access_token}" \ 
    https://speech.googleapis.com/v1/operations/{name} 
+0

非常感謝你的回答。我剛從我的筆記本電腦中檢查,它的工作。我打算用這個做一個簡單的開源應用程序。 –

相關問題