我想分析excel文件並找出數據範圍(最小值,最大值,最小值,最大值,最大值,空白等)。我想要創建一個新的分析文件來分析這些見解。在找進入熊貓庫做到這一點。使用熊貓分析excel
df = pd.read_excel(open('file.xlsx','rb'), sheetname='TestData')
我應該如何着手?
我想分析excel文件並找出數據範圍(最小值,最大值,最小值,最大值,最大值,空白等)。我想要創建一個新的分析文件來分析這些見解。在找進入熊貓庫做到這一點。使用熊貓分析excel
df = pd.read_excel(open('file.xlsx','rb'), sheetname='TestData')
我應該如何着手?
使用numpy的,以獲得最大/最小等功能需要numpy的陣列的,所以無論是切片中的每一列的數據幀,或將數據幀強制轉換爲矩陣
https://docs.scipy.org/doc/numpy/reference/generated/numpy.argmax.html
你可以找到一些你正在尋找的統計數據 - 最小,最大,平均(平均),標準差。偏差爲數字列使用describe()方法
演示:
df = pd.read_excel(r'/path/to/file.xlsx')
In [35]: df
Out[35]:
a b c txt
0 8 5 2 dd
1 6 6 2 aa
2 3 7 9 cc
3 4 2 3 dd
4 3 3 5 cc
In [36]: df.describe()
Out[36]:
a b c
count 5.000000 5.000000 5.000000
mean 4.800000 4.600000 4.200000
std 2.167948 2.073644 2.949576
min 3.000000 2.000000 2.000000
25% 3.000000 3.000000 2.000000
50% 4.000000 5.000000 3.000000
75% 6.000000 6.000000 5.000000
max 8.000000 7.000000 9.000000