以下是一個數據框(DF),其中包含一系列我進行的市場營銷活動。成功百分比顯示受訪者人數,溝通類型指頻道facebook,twitter等(Ai- FB,L1-Linkedin)。筆記本電腦,新的和鼠標是指組成該句子的單詞。原始數據幀有一句話說 - 買一臺新的筆記本電腦,並獲得免費的鼠標。我已經用qdap解析了上面的內容,並在下面生成了DF。在R中設置輸出以生成摘要
Sl NO Success_Percentage communication_type Laptop New Mouse
1 35.46666667 email 1 0 0
2 32.32830821 email 1 0 1
3 22.9226361 SMS 0 1 0
4 21.88888889 SMS 1 1 0
5 40.04085802 FB 0 1 1
6 38.7283237 FB 1 0 1
我已經根據通信類型對DF進行了整理。組成該句子的三個詞語下的值表示在通信期間發送的原始句子中是否存在相同的值。
跨越所有通信最常見的關鍵字是由下面的代碼給出
Wordlist2<-as.data.frame(colSums(DF)[colSums(DF)>0])
的輸出Wordlist2如下
Laptop 4
New 3
Mouse 3
我想知道如何獲得通過子集上面的輸出通訊類型。它可以手動完成,但我想知道是否存在可以執行此操作的程序包。
require(dplyr)
DF%>%
group_by(communication_type, Success_Percentage)%>%
summarise(colSums(DF))
但是,這是行不通的。
你確定嗎?這是一個連續的價值,並在你的例子中獨一無二 –