我試圖在數據集中使用變量的特定順序 - 化合價和 - 實質上將行復制並粘貼到新數據集中。因此,對於每個子ID,對於每個化合價= 0,如果下一個化合價= -1,則將該行復制到稱爲「序列」的新數據集。問題在於試用訂單是隨機的,所以每個子標識的順序是不同的(否則我至少可以根據試用編號寫出一個大的塊狀腳本)。我最初沒有提到的一件重要事情是:每個子標識的值都會有不同的數量,所以行數不是跨子標識的。重新組織數據以計算序列效應
正如數據看起來像一個例子:
SubID location valence reaction_time
1 1 0 500
1 1 -1 600
1 0 1 400
1 0 0 500
2 1 1 700
2 1 0 400
2 0 -1 700
2 0 0 400
我在這種事情幾乎是一個初學者(我猜它需要一個循環?)和唐」 t有一個堅實的起點,所以任何幫助將非常感激。
謝謝!
嗨,我想我看到(有點)腳本是如何工作的。但是我沒有提到的一件事是每個子標識的行數是不同的。我懷疑這就是爲什麼我得到這個錯誤?:'tapply(seq_len(79155L),list('factor(data $ SubID)'= integer(0))中的錯誤,: 參數必須具有相同的長度' – Mik
嗯, (我試着通過修改你的玩具數據集來試試)長度(factor(data $ SubID))== nrow(data)'?(另外,我編輯了答案,因爲我剛剛意識到了因素...)'是無關的。) –
'length(factor(data $ SubID))== nrow(data)'returns FALSE – Mik