2013-06-05 56 views
1

我有一些大約20分鐘持續時間的時間序列數據的熊貓數據幀。當我打電話給他們時,有些圖顯示x-ticks爲hh:mm:ss,而其中一些顯示爲hh:mm。熊貓時間序列圖xticks二級粒度

比較輸出圖形時會造成混淆。我該如何強制hh:mm與其他人一樣擁有二級粒度?

每從第一評議的要求,這裏是產生HH一個數據幀:mm:ss的格式情節

In [68]:dfd 
    Out[68]: 
    <class 'pandas.core.frame.DataFrame'> 
    DatetimeIndex: 1193 entries, 2013-05-30 00:00:00 to 2013-05-30 00:19:59 
    Data columns: 
    disk_util 1193 non-null values 
    dtypes: float64(1) 

    In [69]: 
    dfd.plot() # this gives hh:mm:ss plot 

但是這一次給出了HH:MM格式的情節:

In [63]: dfn 
    Out[63]: 
    <class 'pandas.core.frame.DataFrame'> 
    DatetimeIndex: 1197 entries, 2013-05-30 00:00:00 to 2013-05-30 00:19:56 
    Data columns: 
    net_util 1197 non-null values 
    dtypes: float64(1) 

    In [64]: dfn.plot() 
+2

發佈一些示例代碼供我們嘗試。 –

+0

謝謝!我從csv文件中讀取數據,而不是從代碼中讀取數據。請參閱http://nbviewer.ipython.org/urls/raw.github.com/changhiskhan/talks/master/pydata2012/pandas_timeseries.ipynb對於以hh:mm格式顯示xticks的情節輸出[20]。我們如何讓它顯示二級粒度? –

+0

發佈兩個數據幀值進行比較。 –

回答

0

當我陰謀數據幀的子範圍是給hh:mm格式x-scale刻度,我看它給出hh:mm:ss格式化的x-ticks。這表明大熊貓在超過特定尺寸時正在優化蜱的顯示。

上面我還注意到,上面的disk_util數據框有1193個樣本,但時間跨度爲2013-05-30 00:00:00至2013-05-30 00:19:59,這意味着有一些時間戳時沒有讀數。這種不完美可能導致大熊貓沒有將顯示器設爲hh:mm格式。

雖然net_util 1197非空值有時間跨度2013-05-30 00:00:00至2013-05-30 00:19:56這意味着沒有缺少樣本,熊貓優化顯示爲hh:mm 。

當我從數據框中人爲刪除一個樣本(df = df.drop(20))時,它會引入一個缺失的樣本,圖形以hh:mm:ss格式顯示。所以我的問題現在已經解決了。