通過大熊貓的數據幀循環，同時使用正則表達式

丹尼爾·Kasatchkow（下同）建議將行的值，我曾嘗試以下操作：

df._links.str.findall('qwer://abc\\\.x-data\\\.orc/v1/i/\d+/users')

，但我得到以下輸出：

0 NaN 
1 NaN 
2 NaN 
3 NaN 
4 NaN 
5 NaN 
...

UPDATE - 仍然無法找到lution

來源

2016-12-15 LearningToPython

是否是'link_re'或'regex_l'？ –

@ Jean-FrançoisFabre對不起，修正。謝謝。它是'regex_l' :) – LearningToPython

你的正則表達式模式需要轉義\和'.'字符。另外，通常你需要用圓括號捕捉你的匹配。 – moogle

嘗試是這樣的

import pandas as pd 

df = pd.DataFrame(["{u'users': {u'href': u'qwer://abc\.x-data\.orc/v1/i/32/users'}, u'self': {u'href': ...","{u'users': {u'href': u'qwer://abc\.x-data\.orc/v1/i/87/users'}, u'self': {u'href': ..."], columns=['_links']) 

df._links.str.findall('qwer://abc\\\.x-data\\\.orc/v1/i/\d+/users')

當使用正則表達式我發現它有助於試製出了正則表達式的http://pythex.org/

如果數據是在字典中的格式，這將是最好把它轉換使用pandas.DataFrame.from_dict

來源

2016-12-16 07:12:18

通過大熊貓的數據幀循環，同時使用正則表達式

回答

相關問題