如何在python中應用sas格式化？

我想創建在Python中的交叉列表頻率表，如SAS中的2路頻率。如何在python中應用sas格式化？

在SAS中，他們使用PROC FORMAT來根據需要在輸出中顯示少量內容。

如何在Python實現這一目標？例如，數據集中的一個得到了一個列有AGE_GROUP 1,2,3,4,5,6,7類和8

但在打印輸出，我想把它們顯示爲'0-23'，'24-27'，'48-59'，'60-71'，'72-79'，'80-87'，'88-99'和'100+'分別與他們的頻率。（注意：我不想更改原始數據）。

我檢查了幾個格式化選項，但他們中的大多數似乎是浮點等。我應該如何進行打印定製格式？

感謝

來源

2016-07-07 marupav

可以使用cat.rename_categories()方法重命名的類別。如果您想要使用原始級別，則可以使用cat.codes來獲取基礎整數。這裏有一個重複的例子：

df = pd.DataFrame({'age_group':["1","2","3","4","5","6","7"]}, 
        dtype="category") 

# Rename categories 
df.age_group = df.age_group.cat.rename_categories([ '0-23','24-27','48-59', 
                '60-71','72-79','80-87','88-99']) 
# Test 
> df 
    age_group 
0 0-23 
1 24-27 
2 48-59 
3 60-71 
4 72-79 
5 80-87 
6 88-99 

# Underlying integers 
> df.age_group.cat.codes 
0 0 
1 1 
2 2 
3 3 
4 4 
5 5 
6 6 
dtype: int8

另外，如果你的列並非是絕對的，你可以使用字典結合.replace()打印的相關值。

# Create data and dictionary 
df = pd.DataFrame({'age_group':[1,2,3,4,5,6,7,8]}) 
d = {1:'0-23',2:'24-27',3:'48-59',4:'60-71',5:'72-79',6:'80-87',7:'88-99'} 

# Print matching values 
df.replace({"age_group": d}) 
    age_group 
0 0-23 
1 24-27 
2 48-59 
3 60-71 
4 72-79 
5 80-87 
6 88-99

來源

2016-07-07 10:36:15 mtoto

@mtoto ....如果他們不在類，我需要將其轉換並應用上面的程序？有沒有重命名類別，如適用格式欄只是爲了打印任何其他方法，因爲當我想看到df，它應該還有代碼，當我打印時，應該應用該格式。 – marupav

請參閱編輯，讓我知道這是否工作。 – mtoto

如何在python中應用sas格式化？

回答

相關問題