2016-12-09 57 views
1

我正在使用節點sdk來使用IBM watson語音到文本模塊。在發送音頻樣本並接收到響應之後,置信因子看起來很奇怪。IBM Watson語音信任差異文本

{ 
    "results": [ 
    { 
     "word_alternatives": [ 
     { 
     "start_time": 3.31, 
     "alternatives": [ 
     { 
      "confidence": 0.7563, 
      "word": "you" 
     }, 
     { 
      "confidence": 0.0254, 
      "word": "look" 
     }, 
     { 
      "confidence": 0.0142, 
      "word": "Lou" 
     }, 
     { 
      "confidence": 0.0118, 
      "word": "we" 
     } 
     ], 
     "end_time": 3.43 
    }, 
... 

... 
], 
"alternatives": [ 
    { 
     "word_confidence": [ 
     [ 
      "you", 
      0.36485132893469713 
     ], 
... 

和我要求的識別與此配置:

var params = { 
    audio: fs.createReadStream(req.file.path), 
    content_type: 'audio/wav', 
    'interim_results': false, 
    'word_confidence': true, 
    'timestamps': true, 
    'max_alternatives': 3, 
    'continuous': true, 
    'word_alternatives_threshold': 0.01, 
    'smart_formatting': true 
    }; 

注意如何置信度的單詞「你」是在這兩個地方不同。這些數字中有一個與衆不同?這裏發生了什麼?

+0

第二個「你」的開始時間是什麼?有信心的那個0.36485132893469713 – lCapp

回答

1

約翰,在「word_alternatives」中出現的置信度值來自混淆網絡,並且處於單詞級別,而置於「備選方案」列表中的置信度值是在句子級別上的格子上計算的。

混淆網絡來自格子,但包含假設空間的不同表示,這解釋了爲什麼來自一個或另一個的置信度值可能不同。

在這種情況下,句子只包含一個單詞,這就是爲什麼差異非常明顯。

相關問題