我正試圖實施naïvebayes算法來對mahout中的tweet和facebook數據進行情感分析。我在文本文件中提供了這些推文和facebook數據。我使用的命令轉換這些文件中,以序列文件將序列文件轉換爲向量
倉/亨利馬烏seqdirectory -i /用戶/ hadoopUser /樣品/輸入-o /用戶/ hadoopUser /樣品/ seqoutput
,然後我試圖轉換到載體序列文件,爲了給輸入用命令亨利馬烏
倉/亨利馬烏seq2sparse -i /用戶/ hadoopUser /樣品/ seqoutput -o /用戶/ hadoopUser/vectoroutput -OW -a org.apache。 lucene.analysis.WhitespaceAnalyzer -chunk 200 -wt tfidf -s 5 -md 3 -x 90 -ng 2 -ml 50 -seq
這是將整個文檔轉換爲到矢量,但我想將每個句子轉換爲矢量,因爲我不想對文檔進行分類。我想分類文件中的評論。任何人都可以幫我解決這個問題嗎?