因此,在我的df中有一列包含我爲實驗測試的所有主題。條目被編碼爲x水平的因子。每個科目都經過兩次測試,但是在df中每個科目都有兩個數據集。這些數據集可以有不同的長度。現在我需要通過測試時間(1或2)對主題進行分組,因此我可以將時間作爲固定效果包含在我的模型中。我怎樣才能做到這一點?如何將數據框中的條目分配給不同的組?
這是我的小例子DF:
require("stringr")
>Subject<- c("DG_120204", "DG_120204", "DG_120305", "BZ_120407", "BZ_120506", "BZ_120506", "BZ_120506", "SN_120310", "SN_120412")
s2<- str_extract(Subject, "\\d{6}")
dates<-as.Date(s2, format="%y%m%d")
df<-data.frame(Subject, dates)
Subject dates
1 DG_120204 2012-02-04
2 DG_120204 2012-02-04
3 DG_120305 2012-03-05
4 BZ_120407 2012-04-07
5 BZ_120506 2012-05-06
6 BZ_120506 2012-05-06
7 BZ_120506 2012-05-06
8 SN_120310 2012-03-10
9 SN_120412 2012-04-12
例如,第2項爲主題DG從測試環節1,第三行是會議2,4號線是會議1主題BZ ,第5至第7行是BZ的第2次會話,以此類推。
我的想法是添加另一個因子列(df $ time),並根據df $ Subject(以及df $日期中的日期值)的級別填充1和2。但現在我甚至沒有那麼遠。
所以我應該有這樣的事情:
Subject dates time
1 DG_120204 2012-02-04 1
2 DG_120204 2012-02-04 1
3 DG_120305 2012-03-05 2
4 BZ_120407 2012-04-07 1
5 BZ_120506 2012-05-06 2
6 BZ_120506 2012-05-06 2
7 BZ_120506 2012-05-06 2
8 SN_120310 2012-03-10 1
9 SN_120412 2012-04-12 2
我知道這又是一個很基本的問題,請多多包涵!我將最終了解...
也許我只是密集的,但我沒有看到日期和時間之間的聯繫?你怎麼知道哪些日期對應於時間== 1和時間== 2?如果你知道這一點,那麼看看'ifelse()'或者'transform()'來保持整潔。 – Chase
@Chase:我只知道它,因爲較早的測試日期是會話1,而較晚的測試日期是會話2。但是,每個主題的日期不同。我會檢查你建議的功能... – kat