2017-08-10 94 views
1

我有我的熊貓數據框包含以下格式的數據:修改數據框列值

SAC1001.K 
KAM10120.B01.W001 
CLT004.09C 
ASMA104 
AJAY101.A.KAS.101 

我想使用字符串操作,以便修改列,該結果是

SAC1001.K 
KAM10120.B01 
CLT004.09C 
ASMA104 
AJAY101.A 

這怎麼可以做到?正則表達式看起來是一種方式,但不確定。任何其他優雅的方式來做到這一點?請指導

回答

2
In [109]: df 
Out[109]: 
       col 
0   SAC1001.K 
1 KAM10120.B01.W001 
2   CLT004.09C 
3   ASMA104 
4 AJAY101.A.KAS.101 

In [110]: df['col'] = df['col'].str.replace(r'(\..*?)\..*', r'\1') 

In [111]: df 
Out[111]: 
      col 
0  SAC1001.K 
1 KAM10120.B01 
2 CLT004.09C 
3  ASMA104 
4  AJAY101.A 
1

這裏是沒有正則表達式的另一種方式,但也許有太多的海峽

df['col'].str.split('.').str[:2].str.join('.')