我是一名生物學學生,在我們的實驗室,我們正在用鼠標測試某種藥物。在正常狀態下,我們有很多套的基因表達數據的生物學重複: gene replicate 1 replicate2 gene1 -0.842138 -0.701153 gene2 -0.796896 -0.725085 gene3 -0.835920 -0.707572 gene5 -0.702721 -0.724579 gene6 -0.815476 -0.737112 .... gene 20000
each dot represent a gene生物方差或真正受影響的基因。
,並與藥餵它們後,我們有一個新的基因表達數據: after medicine treatment
我的問題是,如何我可以將那些真正受影響的基因與那些僅僅是生物差異(重複之間的差異)的基因分開?
我是機器學習的新手,我相信監督學習應該是我的選擇,對嗎?培訓數據是我的重複數據,然後我可以測試藥物治療後的每個基因是否可以落入由重複確定的「耐受區」。但我不確定應該使用哪種方法。任何指導提前讚賞。
哦,男孩。我需要一分鐘.. – ZombieChowder