2016-07-11 94 views
-4

我有一個字符串,我想只提取它裏面的一些信息。從Python中的字符串中提取信息?

例如,我有這樣的:

'Won 3 Oscars. Another 80 wins & 121 nominations.' 

而且我想它在訂單拆分得到像這樣的列表:

['3 Oscars', '80 wins', '121 nominations'] 

怎麼辦我在Python呢?

由於

+0

您應該定義什麼是您的提取信息的約束。數字後跟單詞?每第二和第三個元素? – MisterMiyagi

回答

2

隨後空間,一個然後字邊界。這應該這樣做:

import re 

s = 'Won 3 Oscars. Another 80 wins & 121 nominations.' 
p = re.compile(r'\d+\s\w+\b') 

print(p.findall(s)) 
# ['3 Oscars', '80 wins', '121 nominations']