這是一個非常基本的問題......我確信它寫在這裏的某處......我試圖創建一個新變量(遺傳學數據)檢查指定變量中的「字符串」表達式是否包含在其他幾個變量中
例如(對於那些不知道遺傳學的人): 對於一個家庭(每行一個),我有父親,母親和孩子基因型表示爲A/G,G/A,G/G(作爲單獨的變量)。我想創建一個新的0/1或False/True變量,告訴我孩子的等位基因1是否在母親基因型的任一等位基因中出現,或者在父親基因型的任一等位基因中出現。同樣對於等位基因2.
我嘗試使用regexpr如下,以R:
vcf_GT$MVLR <- regexpr(c(sapply(strsplit(as.character(vcf_GT[,10]),"/"),function(x) x[1])),
(sapply(strsplit(as.character(vcf_GT[,10]),"/"),function(x) x[2])),
(c(c(sapply(strsplit(as.character(vcf_GT[,9]),"/"),function(x) x[1])),
(sapply(strsplit(as.character(vcf_GT[,9]),"/"),function(x) x[2])),
c(sapply(strsplit(as.character(vcf_GT[,8]),"/"),function(x) x[1])),
(sapply(strsplit(as.character(vcf_GT[,8]),"/"),function(x) x[2]))))) > 0
與代表兒童的基因型的柱10,及圖9和圖8分別表示母親和父親的。這很乏味,我可能忘記了這裏的括號。
必須有一個更簡單的方法來檢查與母親和父親的孩子的基因型。
在此先感謝!
P.S.如果我沒有道理 - 我會嘗試添加更多細節。
編輯:雖然我的代碼實際上是一個巨大的線,按要求我增加了回報,它更容易閱讀(不過,它的種很難不管:))
我鼓勵你在代碼中使用空格和回車符。它使我們可讀並可爲您調試! – Justin
併發布一些輸入數據與所需的輸出也會很好。 –