2017-02-05 127 views
-3

我想開發我的項目,它要求用戶查看關於電影的簡單的網頁,然後它會自動提交後審覈生成評級。電影情感分析

目前我正在學習NLP(初級)的各種話題,並沒有找到一個合適的方式開始我的項目。我剛學之類的東西符號化,解析,語言模型(卦),分類....只是surfacely,我認爲這樣做有問題的多重方式。

我想特別對這個問題,說明有用的方法(應該產生與滿足的準確率在更短的時間)有效的指導。我認爲python在這種情況下更適合,因爲我可以在幾天內學會。如果有人能夠以更簡單的方式提供解決這個問題的核心摘要,那將是非常好的

回答

0

你應該熟悉Kaggle競賽「袋子的話會遇到爆米花袋」,閱讀他們的tutorial並且重現代碼。你問了一個總結,但NLP,Python和機器學習,並與相關的庫如護目鏡的Word2Vec,熊貓,BeautifulSoup,NLTK,numpy的,更何況是正則表達式,有關的所有細節是不是你學到的東西通過閱讀段落或兩個。這些只是這裏提到的教程的庫。細節是什麼會讓你煩惱。有很多方法可以解決這個問題。從教程開始,當你想出來的時候,看比賽中的其他提交內容。大多數競爭對手已將其代碼發佈到GitHub上。

+0

感謝您的建議,我已經知道如何準備訓練的模式,但在我的情況下,我想我必須第一個從網頁獲取用戶的評論,然後進行清理數據和特徵提取和我沒有得到正確的是關於比較和評分部分。我必須將用戶評論與訓練有素的模型進行比較並生成評分。因爲訓練模型是一次性工作,所以我認爲我應該使用一個良好的預訓練模型。如果我發現錯誤,請讓我清楚。 –