我是一名遺傳學博士生,我正在嘗試使用線性迴歸對一些基因數據進行關聯分析。在下面的表格中,我逐一回顧了每個'SNP'的每個'特徵'。還有一個相互作用項包括'var'新手需要在R中循環lm
我只用了2周的R,沒有任何編程背景所以請解釋提供的任何幫助,因爲我想了解。
這是我的數據樣本:
Sample ID var trait 1 trait 2 trait 3 SNP1 SNP2 SNP3
77856517 2 188 3 2 1 0 0
375689755 8 17 -1 -1 1 -1 -1
392513415 8 28 14 4 1 1 1
393612038 8 85 14 6 1 1 0
401623551 8 152 11 -1 1 0 0
348466144 7 -74 11 6 1 0 0
77852806 4 81 16 6 1 1 0
440614343 8 -93 8 0 0 1 0
77853193 5 3 6 5 1 1 1
,這是我一直在使用一個單一的迴歸代碼:
result1 <-lm(trait1~SNP1+var+SNP1*var, na.action=na.exclude)
我想運行一個循環,每一個特質針對每個SNP進行測試。
我一直在嘗試修改我在網上找到的代碼,但我總是遇到一些我不明白如何解決的錯誤。
謝謝你的任何和所有幫助。
我擔心你沒有描述什麼「特質」數字意味着什麼,或者你爲什麼要獨立分析什麼可能是依賴預測因子。線性迴歸分析假定Y值從10變化到17的意思與200到210的變化完全相同。這就是你想知道的嗎? SNP真的是獨立的嗎?在接受任何答案之前,您應該確保任何在線顧問都已充分採訪您,以提供明智的建議。 –
我很欣賞這些評論。確實,我不太瞭解所有數據,但在我的項目中,這些數據都是由一位適當的統計人員處理的。我不需要進行過分全面的分析。 SNPs顯示了不同程度的依賴性,並且在完美的世界中我想學習所有這些。但現在我只需要在更簡單的層面上運行它。這種分析已經正確完成,我在博士學位期間被告知我沒有學過它。 – user2225633
相信我迪文,我知道它有多荒謬。我正在盡我所能教自己,但很難將我的頭腦統計和編碼。 – user2225633