2015-12-15 191 views
0

在斯坦福情感分析中,我們是否可以選擇將特定/自定義詞語標記爲肯定[基於我們的要求]。添加自定義詞典

由於使用的商業術語,分析推文呈現負面趨勢。我們是否可以通過添加我們的自定義字典來處理它,以消除由於這些詞造成的負面輸出?

回答

0

最簡單的方法是重新訓練情感模型。獲取sentiment training data並手動修改您擔心的字詞的標籤。有非常基本的訓練指導on another Stanford Sentiment page。然後使用這個訓練有素的模型!

一個非常骯髒但可能更快的解決方案是在事實之後修改從標準模型中獲得的樹。例如,您可以在分析樹中搜索感興趣的單詞並手動修改其情緒標籤。然後應用一些啓發式方法,以便在樹上傳播此修改,並可能改變整個句子的情緒。

+0

我嘗試修改情感標籤,它沒有給出預期的結果。修改後需要轉換樹嗎?我們如何在樹上傳播這個修改? – Mars

+0

是的,如果你想修改整個句子的情緒,你必須做一些傳播啓發式,從你修改的葉子遍歷樹。這很可能會非常棘手並且不夠健壯(當有3個修改過的單詞時,你會做什麼?5),而第一個選項肯定是頭痛較少的那個。 –