我想繪製一個來自熊貓數據框的2列數據的熱圖。但是,我想用第三列標記x軸,理想情況下是通過顏色標記,但另一種方法(如附加軸)也同樣適用。我的數據幀是:具有特定軸標籤顏色的熱圖
MUT SAMPLE VAR GROUP
True s1 1_1334442_T CC002
True s2 1_1334442_T CC006
True s1 1_1480354_GAC CC002
True s2 1_1480355_C CC006
True s2 1_1653038_C CC006
True s3 1_1730932_G CC002
...
只給數據的一個更好的想法;有9種不同類型的'組',約6萬種'VAR'和540'SAMPLE's。我不知道這是建立在python熱圖的最佳方式,但這裏是我想通了,至今:
pivot = pd.crosstab(df_all['VAR'],df_all['SAMPLE'])
sns.set(font_scale=0.4)
g = sns.clustermap(pivot, row_cluster=False, yticklabels=False, linewidths=0.1, cmap="YlGnBu", cbar=False)
plt.show()
我不知道怎麼去「集團」沿x軸顯示,作爲附加軸還是隻着色軸標籤?任何幫助將非常感激。
我不確定'MUT'列是否是一個布爾變量是一個問題,df_all在每個'VAR'上都是'TRUE',但是隨着樞軸的進行,任何沒有特定'VAR '填充爲0,其他填充爲1.我的目標是嘗試對具有類似'VAR'配置文件的樣本進行聚類。我希望這有幫助。
請讓我知道,如果我可以進一步澄清?非常感謝
這有助於瞭解這可以做到。然而,我的df的結構與虹膜不同,因爲我已經制作了原始df的2列的數據透視表和交叉表,並且正在繪製基於此輸出的熱圖。我需要重新添加'GROUP'的另一列來使我的df等價於虹膜。我正在努力使用熊貓方法來做到這一點。我可以啓動一個新列,然後迭代df,併爲每一行添加哪個'GROUP'到新列,但它看起來非常麻煩 - 你知道熊貓的方法嗎? – user3062260