我正在開發一個NLP項目,其中列出了所有與讚賞有關的電子郵件。我試圖從電子郵件內容中確定誰被讚賞。這反過來會幫助組織在我們的績效評估計劃中。使用ML/NLP識別電子郵件中引用的人
除了識別誰被讚賞之外,我還試圖確定一個人完成的工作類型並對其進行評分。我使用開放的NLP(最大熵/邏輯迴歸)對電子郵件進行分類,並使用某種形式的啓發式來識別被讚賞的人。
的人識別的方法如下:
- 確定是否電子郵件是與升值
- 獲取的人的名單在「To:」如果那個人是列表
- 檢查被中提到的電子郵件
- 標記,人爲升值的接收器
然而,這Appro公司ach非常簡單,不適用於我們通常看到的複雜電子郵件。一封電子郵件可以由許多電子郵件ID或被引用的人組成,並且他們不是欣賞的接受者。該人的背景是不可用的,因此準確性不是很好。
我正在考慮使用HMM和word2vec來解決人員問題。如果有人遇到此問題或有任何建議,我將不勝感激。
你應該給你的文本的樣本。 – Daniel