2017-08-26 98 views
0

Python的數據分析(2E,219)說:熊貓指數名稱,軸標籤和水平

enter image description here

但我不幸的是,混淆。所以:

  • 什麼是「索引名稱」?
  • 什麼是「軸標籤」?
  • 什麼是「軸水平」?
  • 「行」和「列」屬於哪個類別?

回答

1

請考慮以下DataFrame。

colidx = pd.MultiIndex.from_product([('Yes', 'No'), ('Yes', 'No')], 
            names=['Heart Disease', 'High Blood Pressure']) 
rowidx = pd.MultiIndex.from_product([('Female', 'Male'), ('Single', 'Married')], 
            names=['Sex', 'Marital Status']) 

df = pd.DataFrame(np.random.randint(10, size=(4, 4), index=rowidx, columns=colidx)) 
 
Heart Disease   Yes  No 
High Blood Pressure Yes No Yes No 
Sex Marital Status    
Female Single   5 0 3 3 
     Married   7 9 3 5 
Male Single   2 4 7 6 
     Married   8 8 1 6 

這基本上是由四個類別細分一個交叉表。在行中,它有SexMarital Status,並且它有Heart DiseaseHigh Blood Pressure

它有四行四列。第一行的標籤是(Female, Single)。 Wes使用axis label作爲本書中特定行或列的名稱。對於行和列,熊貓使用與numpy相同的術語,行變爲axis=0,列變爲axis=1

一個軸可能有不同的級別。在示例DataFrame中,行或第0軸有兩個級別:SexMarital Status。對於axis=1,等級爲Heart DiseaseHigh Blood Pressure。您也可以分別稱它們爲index namescolumn names