我的要求是獲取新聞文章並確定它們對於某個主題是正面的還是負面的。我正在採取下面概述的方法,但我一直在閱讀NLP可能在這裏使用。我所讀到的所有內容都指出NLP從事實中發現了意見,我認爲這對我來說並不重要。我想知道兩件事:情緒分析的最佳算法方法
1)爲什麼我的算法不工作和/或我該如何改進它? (我知道諷刺可能是一個陷阱,但我再也看不到發生在我們將得到的新聞類型中的太多)
2)NLP如何幫助,我爲什麼要使用它?
我的算法方法(我的正面,負面和否定詞的詞典):
1)計數第
2)的正面和負面的詞數。如果一個否定詞發現2或3個字的正面或負面的詞,(即:不是最好的)否定得分。
3)將得分乘以手動賦予每個單詞的權重。 (1.0開始)
4)加起來的積極和消極得到情緒分數。
情感分析定義爲NLP的一種形式;你正在處理自然語言文本。要確切知道你的方法將如何工作,唯一的方法就是嘗試一下。方便的是,這也會告訴你它是否適用於你的目的,這實際上是重要的部分。 – 2010-11-16 22:48:29
看到這個問題及其答案在實踐中運行良好的簡單算法:http://stackoverflow.com/questions/3920759/untrained-sentiment-analysis – 2010-11-17 11:33:34
我的算法是最好的算法。因爲我是一個在情感分析中做研究的研究生,而且我有很大的自我*:)* – 2010-12-03 20:24:09