我有一個文件.ped誰包含多列,我想從中提取信息。 這裏我的數據的樣本(沒有標頭):使用r的數據處理
1 1 1
1 2 1
2 3 2
3 4 1
3 5 2
...
第一列表示的ID家族,第二個ID的個體,個體的第三性別。
我讀表作爲數據幀
ped <- read.table("pedigree.ped", header=FALSE)
我如何計算家庭的數量存在(一個家庭可以出現一個以上的時間,我要考慮他們作爲一個)? 我有一個性別專欄,其中1個指定男性和2個女性,我如何獲得數據集中男性和女性的分佈?
我是R新手,如果你可以給一些代碼!
謝謝先進。
請發送您的數據樣本。 – 2013-04-06 01:48:27
^^^ this - 'head(ped)' – Nishanth 2013-04-06 01:50:12
請給我指數 – 2013-04-06 02:14:51