2012-10-23 12 views
-1

我有22810行9列(類型的啓動子)和數據的子集的RMA歸一化的基因表達datset如下:hierarchial聚類的在r中的基因表達

ID_REF GSM362180 GSM362181 GSM362188 GSM362189 GSM362192 
244901 5.094871713 4.626623079 4.554272515 4.748604391 4.759221647 
244902 5.194528083 4.985930299 4.817426064 5.151654407 4.838741605 
244903 5.412329253 5.352970877 5.06250609 5.305709079 8.365082403 
244904 5.529220594 5.28134657 5.467445095 5.62968933 5.458388909 
244905 5.024052699 4.714631878 4.792865831 4.843975286 4.657188246 
244906 5.786557533 5.242403911 5.060605782 5.458148567 5.890061836 

我想要做上述的以及聚類試圖分級聚類:

d <- dist(as.matrix(deg), method = "euclidean") 

其中度是差異表達的基因(4300號)。而我得到以下警告的矩陣:

Warning message: 
In dist(as.matrix(deg), method = "euclidean") : NAs introduced by coercion 

在警告的情況下進行聚類是否合適?

hc <- hclust(d) 
plot(hc, hang = -0.01, cex = 0.7) 

我得到一個樹狀圖,這是非常密集和標籤不明確:此外,我不知道該9個促銷員的分類樹的幾個基因:它是如何將有可能標記樹與發起人以及如何將基因可視化爲更清晰的樹狀圖? Iam不確定我是否需要在這裏添加樹狀圖。

+0

它是如何將有可能再現這裏整個數據? –

+0

是的,我嘗試了20和500升級我仍然得到相同的錯誤。 –

+0

我已經完全嘗試過在問題中發佈的同一個(對於6行和5列)並仍然出現錯誤。 –

回答

1

繼您的評論後,我無法重現您的錯誤。我讀的數據:

##Read in the data 
deg = read.table(textConnection("ID_REF GSM362180 GSM362181 GSM362188 GSM362189 GSM362192 
244901 5.094871713 4.626623079 4.554272515 4.748604391 4.759221647 
244902 5.194528083 4.985930299 4.817426064 5.151654407 4.838741605 
244903 5.412329253 5.352970877 5.06250609 5.305709079 8.365082403 
244904 5.529220594 5.28134657 5.467445095 5.62968933 5.458388909 
244905 5.024052699 4.714631878 4.792865831 4.843975286 4.657188246 
244906 5.786557533 5.242403911 5.060605782 5.458148567 5.890061836"), header=TRUE) 

然後我可以計算距離矩陣:

R> dist(as.matrix(deg), method = "euclidean") 
     1  2  3  4  5 
2 1.173       
3 4.266 3.701     
4 3.423 2.288 3.120    
5 4.011 3.038 4.312 1.814  
6 5.282 4.204 3.912 2.109 1.957 
+0

我想我在讀取數據時發生錯誤。非常感謝你。 –

+0

爲什麼textConnection被用來讀取數據? –

+0

因爲你沒有提供簡單的方法來導入你的數據,所以把它複製到一個字符串中,然後告訴R它是一段文本,它應該正確解析它,這是獲取數據的最簡單方法。你可以[閱讀此](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)以獲取更多關於如何製作一個好的重現性示例的信息。 – Dason