2017-10-09 43 views
1

問題描述認知服務翻譯和篩選出褻瀆

我用認知服務TranslateArray翻譯我的用戶評論。一個這種服務的好處是,我們可以使用ProfanityAction到目標語言中的每個詞褻瀆標記。我還利用自動語言檢測功能,以便在發送內容之前不必識別內容。

當我的翻譯返回到與源語言匹配的目標語言時,未標記褻瀆語言。是否有另一個端點,我可以/應該打,或參數我不知道,還是有服務的一個可能的改進?

相應的文件

按照認知服務協議擊中TranslateArray端點,包含髒話的英文句子,用ProfanityAction:標記行爲:http://docs.microsofttranslator.com/text-translate.html#!/default/post_TranslateArray

再現步驟

  • 發一個帶有褻瀆的英語句子
  • 翻譯成FR,通知正確標記褻瀆
  • 翻譯成恩,發現丟失的褻瀆標籤

預期行爲

即使沒有翻譯發生

褻瀆應標。

實際結果

我獲得的未經修改的句子後面。

回答

0

文檔中沒有指定如果源語言和目標語言相同會發生什麼情況。我的猜測是,如果它看到它們匹配,它就什麼都不會做。

但是,有一個特定的API可以檢測任何給定語言的褻瀆性語言:Content Moderation for Text。 API文檔是here

文本 - 屏幕保護功能,所有這一切 - 掃描褻瀆輸入文本(最多1024個字符),autocorrects文本,並提取個人身份信息(PII),同時還能對術語的自定義列表匹配。

0

您的觀察結果是,如果源語言和目標語言相同,則翻譯API不執行任何操作,這是正確的。不是一個答案,只是澄清。