2016-04-17 206 views
-1

因此,我正在測試語言翻譯 - 識別API,這很奇怪 - 它確定西班牙語很好,但不是英語。咦?檢查了這一點...Bluemix語言識別不識別英語

轉到https://watson-api-explorer.mybluemix.net/apis/language-translation-v2#!/identify/identifyLanguageGet

在框中粘貼這樣的文字:

邁克爾是+ A +硬盤+工作+學生+誰+表演+責任+ +中+他日報+工作+他是+熱情%2C +經營+在+他+學習%2C +主動+ +所有+品質+通過+參與+ +他+等級+和+能力+到+自我所示+ -assess +他+工作+他+擁有+成爲+非常+好+在+識別+他+實力+和+使用+反饋+到+改善+和+修改+他+作業+上+一個恭喜+ +大+第一+學期。

我回到「et」這是愛沙尼亞語。咦?

如果我進入這個文本(與以前一樣,但在末端一個或多個字符):

邁克爾是+ A +硬盤+工作+學生+誰+表演+責任+在+他+日報+工作+他是+熱情%2C +經營+在+他+學習%2C +主動+ +所有+品質+通過+參與+ +他+等級+和+能力+到+自我所示+ -assess +他+工作+他+擁有+成爲+非常+好+在+識別+他+實力+和+使用+反饋+到+改善+和+修改+他+作業+上+一個恭喜+ + great + first + semester。%21

我得到「ja」這是日語。我也不時得到「ht」,這是海天克勞利......你好沃森?英語??

+0

好的。你有問題嗎? – JJJ

+0

是的 - 問題是爲什麼我不懂英文? –

+0

因爲在線UI需要純文本,而不是URL編碼的文本。如果你刪除'+' - 標誌並粘貼「邁克爾是一個努力工作......」你會得到英語。 – JJJ

回答

0

絕對是一個編碼問題。正如文檔所說,每件事都必須嚴格按照UTF-8進行。

即使在POST請求中,即使您確實需要對文本進行編碼,文本也必須嚴格使用UTF-8。這是我的一個挑戰,顯然你正在用語言翻譯處理很多重音字符。