1
我的數據幀(DF)是這樣的:如何計算我的評論中有多少條評論包含列表中的單詞?
Comments
-----------------
1 | comment1
2 | comment2
3 | comment3
4 | comment4
...
我已經建立2名名單如下:
list1<-c("money","finance","aid")
list2<-c("major","degree")
我想通過行搜索在具有來自不同人的評論的數據幀中。當任何的list1
詞語的特定行被發現,counter1
應該遞增,當list2
字被發現counter2
應該增加
我想要得到的結果爲:
counter1=10 ; counter2=25
注:我不不希望在每個單詞頻率增加計數器。例如,如果評論同時包含「金錢」和「財務」,則計數器只應增加一次。但如果它有「金錢」和「主要」,counter1和counter2都應該增加。
它並沒有完全適用於我的數據框。注意到差異後,我發現該列只有1級的因子,但它有2351行。你能幫我解決嗎? –
如果你的數據框是'df',並且你的列被稱爲'txt',則執行'df $ txt < - as.character(df $ txt)'。如果這不起作用,可能值得開一個關於這個問題的新問題,就像上面提到的一個可重複的例子(https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-可重現的例子),請提供樣品數據! – Florian
謝謝弗洛裏安......它確實工作......我得到了我的完美解決方案...... –