我有3個數據集(txt.gz),我已經對它們進行了子集化,使其僅包含p值爲1 * 10^-6或更小的觀測值。過濾掉3個數據集之間的常見觀測值
下一步是檢查一個通用名稱變量(名稱是指SNPs,遺傳學)。
當前表:
name pval
rs2575876 8.20660e-07
rs11834972 4.20460e-07
rs11050138 4.23080e-07
rs12313631 7.13600e-07
rs485538 5.99060e-07
任何想法?
您可以發佈'頭(your.data)'所有名稱中出現多個數據集? – Nishanth 2013-04-11 14:47:27
你的問題不清楚。你的三個數據幀格式是什麼? (顯示你到目前爲止的代碼將有助於澄清問題)。 「......具有p值的常見SNP中的SNP」是什麼意思? – 2013-04-11 14:47:28
我猜'%in%'是你的朋友。 – eddi 2013-04-11 15:23:46