假設我有一個三列的數據框:第一個指定一個特徵的數量(例如顏色),第二個指定一個組,第三個指定特徵存在於該組(1)或缺少組(0):比較第一列中指定的組之間的交集
> d<-data.frame(feature=c("red","blue","green","yellow","red","blue","green","yellow"), group=c(rep("a",4),rep("b",4)),is_there=c(0,1,1,0,1,1,1,0))
> d
feature group is_there
1 red a 0
2 blue a 1
3 green a 1
4 yellow a 0
5 red b 1
6 blue b 1
7 green b 1
8 yellow b 0
現在我想有一個總結多少的特點是:1,只在一組,僅在b組和多少目前在兩個組中。此外,我需要提取兩個組中存在的功能的名稱。我怎樣才能做到這一點?我想像crossprod
這樣的函數可能會有所幫助,但我無法弄清楚。
輸出會是這樣的:
feature
red 1
blue 2
green 2
yellow 0
或:
feature a b
red 0 1
blue 1 1
green 1 1
yellow 0 0
反正我需要在一個比較大的數據文件一個更好的概述(原擁有數百功能在約10組) 。
這並不表示黃色不存在於任何一組中?也許我的問題被不客氣地問道。 – aldorado 2014-08-28 09:04:13
@aldorado - 我編輯了 – 2014-08-28 09:09:59
@Richard Scriven +1你的桌子比我的更乾淨 – akrun 2014-08-28 09:30:04