2015-12-20 76 views
6

我想要在IPython筆記本中繪製大型數據集。在IPython筆記本中繪製大型數據集(散景)

我使用read_csv將〜0.5GB .csv文件讀入Pandas DataFrame,這需要大約兩分鐘的時間。然後我嘗試繪製這些數據。

data = pd.read_csv('large.csv') 
output_notebook() 
p1 = figure() 
p1.circle(data.index, data['myDataset']) 
show(p1) 

我的瀏覽器旋轉並且不顯示任何圖。使用ColumnSource對象爲source參數circle()

  • 我的數據向下取樣的東西更容易管理的

    1. output_file()代替output_notebook()
    2. 製圖:我曾嘗試以下。

    Bokeh在其網站上宣稱可以通過非常大的流媒體數據集提供「高性能的交互性」。我如何可視化這些大型數據集而不使計算機停止工作?

  • 回答

    7

    該問題太寬泛,無法提供任何特定的代碼建議。我會好奇你試過的縮減採樣的大小是多少。默認的HTML Canvas for Bokeh可以容納數以萬計的圈子。有幾個選項:

    +0

    你好@bigreddot請你看看我的這個問題,我真的很難得到解決方案。 http://stackoverflow.com/questions/36207525/how-to-generate-multiple-plots-by-clicking-a-single-plot-for-more-info-usi – Sandy

    +0

    這個問題似乎是關於Matplotlib,而不是背景虛化。恐怕我對Matplotlib一無所知。 – bigreddot

    +0

    感謝您的快速回復,在Bokeh中我可以達到我的要求嗎? – Sandy