我正在熊貓數據框內的一些年份值正常化。如何在給定以下約束的情況下將某些數字連接到另一個數字?
years
0 2011
1 2012
2 2050
3 11
4 23
5 01
....
n 2015
正如你所看到的,有些值是錯誤的,因爲它們必須是4位數。因此,我想將它們轉換成四位數字:
year
0 2011
1 2012
2 2050
3 2011
4 2023
5 2001
...
n 2015
針對以上情況,在previous question我瞭解到,您可以使用函數代替完成這個任務:
df['years'].replace('\b\d{2}\b.*?', r'20\2', regex=True)
我有試過不同的正則表達式:
^[0-9]{2}
^[0-9]{2}.*
(\d\d)*
^(\d{2})
r'\b\d{2}\b'
但是,這些不起作用。因此,如何使用四位數字(添加20
)對上述數據幀進行標準化?
「年份」列的dtype是什麼? – MaxU
@MaxU'year object dtype:object' – tumbleweed