2016-01-19 41 views
0

我使用pandas模塊從csv文件創建了一個python數據框。默認情況下熊貓將字符串轉換爲對象類型。現在從這個字符串中,我想創建另一個列,我試圖使用正則表達式創建。然而,由於該列的對象,我得到錯誤Python熊貓數據框正則表達式從對象中提取子串

data = pd.read_csv(r'Desktop\train.csv') 
desig = re.search(r'(\w+), (\w+). (\w+)',data['Name']).group(1) 

TypeError: expected string or buffer

我如何可以提取對象的部分?

謝謝。

+0

您還應該向我們展示CSV文件中的幾行內容,以便我們確定您嘗試匹配的內容。 –

回答

0

你想使用包含在數據幀的str方法矢量化操作:

data['desig'] = data['Name'].str.extract(r'(\w+), (\w+). (\w+)') 

這實際上對應於三組三列返回一個數據幀。

+0

謝謝你完美的作品 – prasadav

相關問題