我有一個軟件必須處理大量不同的數據,並且可能需要不同的時間來處理它。隨着軟件被修改,需要處理數據變化的時間,所以我想創建一個能夠顯示時間差異以及異常值的圖表,因爲理想情況下,這個程序的每個片段所花費的時間大致相同的數據(這聽起來很奇怪和不切實際,我知道,但只是在這裏跟我一起滾動)。首先,我想到了使用箱型圖,但我認爲它們不夠充分,因爲完全有可能一半數據集圍繞一個值盤旋,另一半圍繞另一個盤旋,而我沒有感覺一個盒子情節會說明這一點。所以我決定嘗試使用直方圖,但我無法弄清楚如何讓matplotlib以我想要的方式繪製它。我想單個圖中,X軸被標記有軟件的版本中,Y軸表示以處理的數據組所花費的時間,與多個直方圖,這樣樣機我提出:與matplotlib多個並排直方圖?
該曲線圖會顯示在版本0.1中,大多數數據集在2-4秒內被處理,由於某些原因,大量數據集需要12秒。 v0.1a擺脫了那些漫長的離羣值,但所有事情都花了更長的時間。 0.1b比0.1a略快。最後,0.2顯示速度提高很多,但又引入了異常值。
我該如何讓matplotlib創建一個這樣的情節?
您可能會對小提琴情節感興趣。我認爲最新的matplotlib具有小提琴功能,就像在matplotlib上建立的seaborn庫一樣。 – BrenBarn 2014-09-19 21:37:57
1.4確實有內置的小提琴劇情。 – tacaswell 2014-09-20 21:33:02