我打印出一列變量的摘要作爲這樣:如何建立從表中的新列(/data.frame),並分配相應的值對行
summary(document$subject)
A,B,C,D,E,F,..是屬於數據框中的一個列的對象,其中A,B,C ......在該列中多次出現,上面的概要顯示這些主題出現在文件中的次數(頻率)。此外,術語「其他」是指在文件中僅出現一次的那些主題,我還需要爲這些主題指定「1」。
有很多不同的主題,如果我們使用命令「c」,很難列出所有這些主題。
我想建立一個新的列(或data.frame),然後將這些相應的數字(分數)分配給主題。理想情況下,它會在文件中變成這樣:
A 198
B 113
C 96
D 69
A 198
E 65
F 62
A 198
C 113
BZ 21
BC 1
CJ 1
...
我不知道什麼命令我應該使用採取分數/值從彙總表,然後建立一個新的列來分配這些值添加到文件中的相應主題。
另外,由於它是由R打印的彙總表,我不知道如何將其構建到文件的表中,或者從表中取出值和主題名稱。我還想知道如何找出文件中只出現一次的主題名稱,以便將摘要表添加到「OTHER」中。
非常感謝你的消息:)這是非常有幫助的,你理解我的問題非常好。但還有一點我需要添加,或者我不確定。由於主題太多,手動列出非常困難,而且由於主題在列中重複出現,我想知道如何使用命令列出這些主題,如上所示?謝謝! – Susie