如何分割數字和文字

我有這樣如何分割數字和文字

data = pd.DataFrame({ 'a' : [5, 5, '2 bad']})

我想將其轉換爲

{ 'a.digits' : [5, 5, 2], 'a.text' : [nan, nan, 'bad']}

我可以得到一個數據集「a.digits」爲波紋管

data['a.digits'] = data['a'].replace('[^0-9]', '', regex = True) 
5 2 
2 1 
Name: a, dtype: int64

當我做

data['a'] = data['a'].replace('[^\D]', '', regex = True)

或

data['a'] = data['a'].replace('[^a-zA-Z]', '', regex = True)

我得到

5  2 
bad 1 
Name: a, dtype: int64

有什麼不對？如何刪除數字？

來源

2016-08-18 Edward

的replace（）方法僅適用於字符串，但它確實對整數什麼。這就是爲什麼你的解決方案不起作用。 –

您可以使用循環來檢查每個元素的類型，如果它是整數（或只保留字符串），則跳過它。 –

這樣的事情就足夠了嗎？

In [8]: import numpy as np 

In [9]: import re 

In [10]: data['a.digits'] = data['a'].apply(lambda x: int(re.sub(r'[\D]', '', str(x)))) 

In [12]: data['a.text'] = data['a'].apply(lambda x: re.sub(r'[\d]', '', str(x))) 

In [13]: data.replace('', np.nan, regex=True) 
Out[13]: 
     a a.digits a.text 
0  5  5 NaN 
1  5  5 NaN 
2 2 bad  2 bad

來源

2016-08-18 19:35:18

假設有2字壞之間的空間，你可以這樣做：

data['Text'] = data['a'].str.split(' ').str[1]

來源

2016-08-18 19:36:04 ropolo

如何分割數字和文字

回答

相關問題