我有兩列數據表格,即Columns列表,即一對疾病和它們的一對。下面是disease_table1在R中繪製圖表
**d1** **d2** **Value**
Disease1 Disease2 3.5
Disease3 Disease4 5
Disease5 Disease6 1.1
Disease1 Disease3 2.4
Disease6 Disease2 6.7
真實數據集1(disease_table1)低於第一個(樣本數據):
Bladder cancer X-linked ichthyosis (XLI) 3.5
Leukocyte adhesion deficiency (LAD) Aldosterone synthase Deficiency 1.8
Leukocyte adhesion deficiency (LAD) Brain Cancer 1.5
Tangier disease Pancreatic cancer 0.66
我想說明這兩個數據表之間的差異,同時繪製疾病對及其兩個表的值。 我使用了plot函數和直線函數,但它太簡單了,不能很好地區分。另外我想在繪圖時有疾病對的名稱。
plot(density(disease_table1$value))
lines(density(disease_table1$value))
感謝
你能否給我們提供一個[reproducable example](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)? – Jaap
我已經添加了真實的數據集,代碼作爲例子。 – Rgeek
400,000+疾病對可能需要一種聚類方法。你可以發佈一個鏈接到你的數據,或更具代表性的子集,說幾千條記錄? – jlhoward