2
我想使用熊貓閱讀https://www.whatdotheyknow.com/request/193811/response/480664/attach/3/GCSE%20IGCSE%20results%20v3.xlsx。如何使用熊貓/ python處理excel文件標題
救了它在我的劇本是
import sys
import pandas as pd
inputfile = sys.argv[1]
xl = pd.ExcelFile(inputfile)
# print xl.sheet_names
df = xl.parse(xl.sheet_names[0])
print df.head()
然而,這似乎並沒有正確處理標題,因爲它給
GCSE and IGCSE1 results2,3 in selected subjects4 of pupils at the end of key stage 4 Unnamed: 1 Unnamed: 2 Unnamed: 3 Unnamed: 4 Unnamed: 5 Unnamed: 6 Unnamed: 7 Unnamed: 8 Unnamed: 9 Unnamed: 10
0 Year: 2010/11 (Final) NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
1 Coverage: England NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
2 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
3 1. Includes International GCSE, Cambridge Inte... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
4 2. Includes attempts and achievements by these... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
所有這一切都應該被視爲註釋。
例如,如果您將電子表格加載到libreoffice中,則可以看到列標題被正確解析並出現在第15行的下拉菜單中,以便您選擇所需的項目。
如何讓熊貓自動檢測列標題的位置與libreoffice一樣?
謝謝。 libreoffice如何知道自動跳過前14行?這就是我認爲可能這個問題更多的原因。 – felix
@felix:FWIW,當我在libreoffice中打開它時,我看到1-14行。我想原則上你可以檢測到一個分組表(或者他們被稱爲什麼)已經被定義並提取出來,但是你可以在一張表上有多個表。 – DSM
我的意思是你看到第1-14行,但第15行顯然被libreoffice識別爲列標題。在我的版本中,第15行的每個字段都有一個下拉菜單。您是否得到相同的東西?這就是我看到http://postimg.org/image/fbgkgxelp/。 – felix