2016-12-15 85 views
1

CNC中通過大熊貓的數據幀循環,同時使用正則表達式

丹尼爾·Kasatchkow(下同)建議將行的值,我曾嘗試以下操作:

df._links.str.findall('qwer://abc\\\.x-data\\\.orc/v1/i/\d+/users') 

,但我得到以下輸出:

0 NaN 
1 NaN 
2 NaN 
3 NaN 
4 NaN 
5 NaN 
... 

UPDATE - 仍然無法找到lution

+0

是否是'link_re'或'regex_l'? –

+0

@ Jean-FrançoisFabre對不起,修正。謝謝。它是'regex_l' :) – LearningToPython

+0

你的正則表達式模式需要轉義\和'.'字符。另外,通常你需要用圓括號捕捉你的匹配。 – moogle

回答

1

嘗試是這樣的

import pandas as pd 

df = pd.DataFrame(["{u'users': {u'href': u'qwer://abc\.x-data\.orc/v1/i/32/users'}, u'self': {u'href': ...","{u'users': {u'href': u'qwer://abc\.x-data\.orc/v1/i/87/users'}, u'self': {u'href': ..."], columns=['_links']) 

df._links.str.findall('qwer://abc\\\.x-data\\\.orc/v1/i/\d+/users') 

當使用正則表達式我發現它有助於試製出了正則表達式的http://pythex.org/

如果數據是在字典中的格式,這將是最好把它轉換使用pandas.DataFrame.from_dict