我是數據挖掘的新手,目前正在致力於RapidMiner中TOI的在線新聞文章。我的目標是獲得顯示文章中提及的最重要內容的結果,或查找隱藏在其中的有價值信息。文本挖掘單個文本文檔
我已完成文章「TOI宣言」http://timesofindia.indiatimes.com/home/specials/lok-sabha-elections-2014/news/TOI-manifesto-An-agenda-for-the-new-government/articleshow/31973967.cms的文檔處理。 我已經應用了標記,過濾和ngram,並得到了一些結果。
我被困在這裏。我不知道如何繼續下去。我應該在RapidMiner中使用哪種技術/算法來獲得所需的結果?
目前尚不清楚「所需結果」是什麼。也許尋找頻率最高的單詞? – fstab
我正在尋找提供有關文章主要信息的句子。有沒有辦法做到這一點? – user3501916