2016-10-04 40 views
-1

您是否認爲有一種方法可以爲現有的四種語言(英語,西班牙語,阿拉伯語和日語)以外的語言開發服務,而無需等待它們由IBM自己開發?IBM Watson針對不同語言的個性洞察力?

我對希臘語中的Tweets感興趣,並且很懷疑他們會很快開發它。 我想過將文本從希臘文翻譯成英文,然後使用該服務,但也許這是馬虎的工作。

回答

0

總之,不容易。在添加新語言時,PI團隊首先收集大量心理調查和相關社交數據。這用於訓練語言特定的模型。然後對該語言中的大量社交媒體數據執行規範化(以獲得百分比)。

您可以將twitter文本從希臘文翻譯成英文,然後通過英文版PI運行。這會給你一些關於給定作者相對於你使用同一個進程運行的其他作者的個人資料的想法。然而,這些配置文件將無法與其他語言相比,他們還將展示社會偏見(一般日文文本例如不止保留美國英語文本)作爲模型並沒有在當地文字專門訓練最後,它會顯示由於翻譯服務使用的翻譯服務而產生的偏見,因爲翻譯服務可能會使用與母語使用者略有不同的文字。因此,知道這些警告;如果你仍然想翻譯,那麼關注原始分數(因爲規範化的分數會誇大社會偏見)。你可以比較這些原始分數來獲得一些一般性的想法。