2011-09-21 87 views
1

這是在使用LingPipe機器學習工具進行情感分析的情況下。如果大段落中的句子有積極/消極的情緒,我必須分類。我知道在LingPipe中使用以下方法使用LingPipe做分層情緒分析

  1. 如果完整段落基於其極性進行分類 - 負值或正值。

    在這裏,我還不知道句子級別的極性。我們仍處於段落級別。我如何確定段落句子級別的極性,以及段落中的句子是否爲肯定/否定句子?我知道LingPipe能夠對一個句子是主觀/客觀的進行分類。因此,使用這種方式,,,,

    ,,,,我應該

  2. 首班車LingPipe上一大組是主觀/客觀的句子。

  3. 使用訓練好的模型從測試段落中提取所有主觀句子。
  4. 根據提取的主觀句子爲極性訓練LingPipe分類器,方法是手動將其標記爲正面/負面。
  5. 現在使用的訓練的極性模式和飼料測試主觀句模型(即通過1個句子經過訓練的主觀/客觀完成),然後確定是否該語句是正/負?

    以上方法有效嗎?在上述提議的方法中,我們知道LingPipe能夠接受極性分類的大型文本內容(段落)。如果我們只通過一個主觀句子來進行極性分類,它會做得很好嗎?我很困惑!

回答

1

包括舌管在內的大多數機器排列庫都是基於行的(具有平面特徵的對象)。所以如果你想用它做一些分層分類,你應該對你的數據進行denormolize。例如,您可以在相同的功能集上使用paragrahp和句子的功能。如果您僅使用單詞分類,則可以創建此類功能PARGRAPH_WORDX = true,SENTENCE_WORDX = true。 其他一些工具包可以讓你表達你的模型而不是反規範化,它就是所謂的圖形模型實例是CRF,ACRF,馬爾可夫模型等實現那些你可以在槌子和Factorie中找到的。

+0

謝謝yura。簡而言之,你的意思是說,如果我使用段落級別的功能集,那麼相同的功能集也可以在句級使用? –

+0

是的,您可以在分類的句子的一個特徵集合中結合段落和句子的特徵。有時它的作品。這就像你想要對樹中的某個節點進行分類,併爲此添加了所有父節點的功能。 – yura

2

你可能想看看在多層次的分析方法在文獻中,例如

Li,S.,et al。 (2010年)。 「開發用於文檔情感分析的組合多級模型」,2010年模式識別國際會議。

Yessenalina,A.,et al。 (2010年)。 「文檔級情感分類的多級結構化模型」2010年10月9 - 11日於美國馬薩諸塞州麻省理工學院召開的2010年自然語言處理實證方法會議論文集,第1046-1056頁。

Multi-水平分析方法在信息檢索中非常常見,如在向量空間相似性搜索的內容索引中。

環境,如菱管是上手的好辦法,但最終你需要使用較低的水平,更細粒度的工具,如尤拉建議。