我很困惑如何去做這件事。假設我在數據框中有兩列。一列是按順序(x)的數字序列,另一列是從第一個或-1(y)指定某個值。這些是匹配實驗的結果,其目標是查看是否拍攝同一個人的多張照片。在下面的例子中,有10張照片,但有6個是獨特的個人。在y列中,如果匹配則報告相應的x。對於不匹配,y是-1(也可能是NAs)。如果每個人超過2張照片,則比賽#將是最近的記錄(照片1,5和7是下面的相同人物)。該組是拍攝照片的時間段(組內沒有匹配!)。希望我有這個例子中右:比較兩列:第二列中的邏輯值是否來自列1?
x <- c(1,2,3,4,5,6,7,8,9,10)
y <- c(-1,-1,-1,-1,1,-1,1,-1,2,4)
group <- c(1,1,1,2,2,2,3,3,3,3)
DF <- data.frame(x,y,group)
我想創建一個新的變量命名獨特的個體,並有一個最終的數據集,每個單獨的單行(即只有6行,而不是10 ),也包括組信息。即如果一個人屬於所有三個羣體,則可能有「111」的值,或者如果僅在第一個和最後一個羣組中就是「101」。有小費嗎?
感謝您詢問產生的數據集。根據我給出的實際數字,我意識到我的小組解釋是不好的,所以我稍微改變了結果。獎金也會很高興,但不是關鍵。
name <- c(1,2,3,4,6,8)
group_history <- as.character(c('111','101','100','011','010','001'))
bonus <- as.character(c('1,5,7','2,9','3','4,10','6','8'))
results_I_want <- data.frame(name,group_history,bonus)
我的話,失誤較多上面固定...使用
您可以添加數據集的結果將是什麼樣子的這個例子中的另一個解決方案? – 2011-12-16 21:49:24