2017-08-07 74 views
-2

的條形圖我具有低於在大熊貓數據幀中的表:每月溫度

0 2017/06/04 00:00:00 31.900000 26.700000 
1 2017/06/04 00:30:00 31.600000 25.000000 
2 2017/06/04 01:00:00 31.400000 24.300000 
3 2017/06/04 01:30:00 31.200000 24.100000 
4 2017/06/04 02:00:00 30.800000 26.000000 
5 2017/06/04 02:30:00 30.500000 27.000000 
6 2017/06/04 03:00:00 30.300000 27.300000 
7 2017/06/04 03:30:00 30.100000 27.600000 
8 2017/06/04 04:00:00 29.900000 27.800000 
9 2017/06/04 04:30:00 29.600000 27.900000 
10 2017/06/04 05:00:00 29.200000 27.900000 
11 2017/06/04 05:30:00 28.900000 27.900000 
12 2017/06/04 06:00:00 30.800000 27.900000 
13 2017/06/04 06:30:00 35.700000 27.900000 
14 2017/06/04 07:00:00 38.300000 26.100000 
15 2017/06/04 07:30:00 37.500000 25.100000 

該表是從Excel文件中使用以下的查詢提取的:

import numpy as np 
df = pd.read_excel(r\temperature.xlsx") 

和我分析並根據數據對它們進行分類並嘗試根據具體範圍的溫度對它們進行分組,但是我不知道如何創建這些具有所需範圍的組,例如< = 5C,10至20C,> = 30C)。

+0

我建議嘗試一些,然後尋求幫助,如果你卡住 – Travis

+1

歡迎來到堆棧溢出!看起來你希望我們爲你寫一些代碼。儘管許多用戶願意爲遇險的編碼人員編寫代碼,但他們通常只在海報已嘗試自行解決問題時才提供幫助。證明這一努力的一個好方法是包含迄今爲止編寫的代碼,示例輸入(如果有的話),期望的輸出和實際獲得的輸出(控制檯輸出,堆棧跟蹤,編譯器錯誤 - 無論是適用)。您提供的細節越多,您可能會收到的答案就越多。 – iFlo

+0

我在熊貓數據框中有下表: –

回答

0

在Pandas中看起來像cut function可能適合您的使用情況。將來,向我們提供代碼來重現您的數據框要比僅僅傾銷它好得多。喜歡的東西:

df = pd.DataFrame([ 
["2017/06/04 00:00:00",31.900000,26.700000], 
["2017/06/04 00:30:00",31.600000,25.000000], 
["2017/06/04 01:00:00",31.400000,24.300000], 
["2017/06/04 01:30:00",31.200000,24.100000], 
["2017/06/04 02:00:00",30.800000,26.000000], 
["2017/06/04 02:30:00",30.500000,27.000000], 
["2017/06/04 03:00:00",30.300000,27.300000], 
["2017/06/04 03:30:00",30.100000,27.600000], 
["2017/06/04 04:00:00",29.900000,27.800000], 
["2017/06/04 04:30:00",29.600000,27.900000], 
["2017/06/04 05:00:00",29.200000,27.900000], 
["2017/06/04 05:30:00",28.900000,27.900000], 
["2017/06/04 06:00:00",30.800000,27.900000], 
["2017/06/04 06:30:00",35.700000,27.900000], 
["2017/06/04 07:00:00",38.300000,26.100000], 
["2017/06/04 07:30:00",37.500000,25.100000]], 
columns = ['time','t_high','t_low']) 

如果你想要做一個溫度列你的分析,給它一個名稱,並定義你所關心的溫度界限:

temps = df['t_low'] 
bins = [23,25,27,30] 

現在,您可以申請熊貓'cut()函數,按您定義的存儲桶對數據進行分組,然後查看一些統計信息。

temps.groupby(pd.cut(temps,bins)).describe() 

      count  mean  std min 25% 50% 75% max 
t_low                
(23, 25] 3.0 24.466667 0.472582 24.1 24.20 24.3 24.65 25.0 
(25, 27] 5.0 26.180000 0.732803 25.1 26.00 26.1 26.70 27.0 
(27, 30] 8.0 27.775000 0.218763 27.3 27.75 27.9 27.90 27.9