IBM Watson語音信任差異文本

我正在使用節點sdk來使用IBM watson語音到文本模塊。在發送音頻樣本並接收到響應之後，置信因子看起來很奇怪。IBM Watson語音信任差異文本

{ 
    "results": [ 
    { 
     "word_alternatives": [ 
     { 
     "start_time": 3.31, 
     "alternatives": [ 
     { 
      "confidence": 0.7563, 
      "word": "you" 
     }, 
     { 
      "confidence": 0.0254, 
      "word": "look" 
     }, 
     { 
      "confidence": 0.0142, 
      "word": "Lou" 
     }, 
     { 
      "confidence": 0.0118, 
      "word": "we" 
     } 
     ], 
     "end_time": 3.43 
    }, 
...

和

... 
], 
"alternatives": [ 
    { 
     "word_confidence": [ 
     [ 
      "you", 
      0.36485132893469713 
     ], 
...

和我要求的識別與此配置：

var params = { 
    audio: fs.createReadStream(req.file.path), 
    content_type: 'audio/wav', 
    'interim_results': false, 
    'word_confidence': true, 
    'timestamps': true, 
    'max_alternatives': 3, 
    'continuous': true, 
    'word_alternatives_threshold': 0.01, 
    'smart_formatting': true 
    };

注意如何置信度的單詞「你」是在這兩個地方不同。這些數字中有一個與衆不同？這裏發生了什麼？

來源

2016-12-09 John Schumacher

第二個「你」的開始時間是什麼？有信心的那個0.36485132893469713 – lCapp

約翰，在「word_alternatives」中出現的置信度值來自混淆網絡，並且處於單詞級別，而置於「備選方案」列表中的置信度值是在句子級別上的格子上計算的。

混淆網絡來自格子，但包含假設空間的不同表示，這解釋了爲什麼來自一個或另一個的置信度值可能不同。

在這種情況下，句子只包含一個單詞，這就是爲什麼差異非常明顯。

來源

2016-12-13 17:18:55

IBM Watson語音信任差異文本

回答

相關問題