2016-09-06 75 views
3

我最近使用Language API來收集工作項目的情緒預測。我有大約1,300個沒有標籤的文檔,我們最初使用NLTK的工具,這是基於詞典中每個單詞的極性估計的術語詞典。我轉向API,在回顧了預測之後,API產生了比NLTK更好的結果。新的Google Natural Language API

我知道工程師可能不想發佈預測引擎的細節,但我很好奇它是如何在高層工作的。如果有人能夠啓發我或者指引我朝着正確的方向發展,我會很感激。例如,「它使用了一個神經網絡,訓練了數十億觀測值」,這將是一個合理的答案。

同樣,我使用這個工作項目,我希望能夠給出一個簡單的理由說明爲什麼我從NLTK切換到API(改進的結果應該說明問題,但我肯定會「好吧,它是如何工作的?」)。

回答

3

語言API是被由谷歌的語言學家註釋公共數據的組合(如賓州樹庫)和專用數據訓練的國家的最先進的機器學習系統的管道。

性能改進相比,類似NLTK來自培訓更多更好數據的組合,以及最先進的機器學習算法,包括但不限於神經網絡。

相關鏈接,討論一些算法:

相關問題