1
我正在使用節點sdk來使用IBM watson語音到文本模塊。在發送音頻樣本並接收到響應之後,置信因子看起來很奇怪。IBM Watson語音信任差異文本
{
"results": [
{
"word_alternatives": [
{
"start_time": 3.31,
"alternatives": [
{
"confidence": 0.7563,
"word": "you"
},
{
"confidence": 0.0254,
"word": "look"
},
{
"confidence": 0.0142,
"word": "Lou"
},
{
"confidence": 0.0118,
"word": "we"
}
],
"end_time": 3.43
},
...
和
...
],
"alternatives": [
{
"word_confidence": [
[
"you",
0.36485132893469713
],
...
和我要求的識別與此配置:
var params = {
audio: fs.createReadStream(req.file.path),
content_type: 'audio/wav',
'interim_results': false,
'word_confidence': true,
'timestamps': true,
'max_alternatives': 3,
'continuous': true,
'word_alternatives_threshold': 0.01,
'smart_formatting': true
};
注意如何置信度的單詞「你」是在這兩個地方不同。這些數字中有一個與衆不同?這裏發生了什麼?
第二個「你」的開始時間是什麼?有信心的那個0.36485132893469713 – lCapp