2015-07-12 61 views
1

拆分操作和操作數,我的運營商:=>=<=><
我的表情是那麼簡單,下面的示例:如何在python

string1 = string2 
string1=string2 
string1= string2 
string1 =string2 
string1>=string2 
string1 >=string2 
string1 >= string2 
string1 <string2 
... 

我需要拆分任何的將上面的表達式分成三個單詞並得到一個充滿運算符和操作數的列表。例如

['string1', '>=', 'string2'] 

我試圖使用re.split但沒有得到合適的結果。任何意見,將不勝感激。

回答

2

你可以試試:

re.split('(\W+)', 'string1 >=string2') 

注意與周圍的括號將\W+保持你根據分裂文字。

如果你想具體和只分割給定的字符串,你可以列出它們,並建立一個正則表達式,分別爲|

+0

謝謝。它返回'['string1','> =','string2']'。是否有可能得到'['string1','> =','string2']'(修飾詞)? – Meysam

+0

@Meysam'[x.strip('')for x in re.split ...]' – Maroun

+0

@Meysam或者你可以使用'map(str.strip,re.split('(\ W +)','string1 > = string2'))' – GHajba

3

這裏是提取數據的代碼,你可以把找到的元素在列表中,如你所願:

import re 
lst = ['string1 = string2', 
    'string1=string2', 
    'string1= string2', 
    'string1 =string2', 
    'string1>=string2', 
    'string1 >=string2', 
    'string1 >= string2', 
    'string1 <string2'] 
pat = re.compile(r'(\w+)\s*([<>=]{1,2})\s*(\w+)') 
for e in lst : 
    matches = pat.search(e) 
    print matches.group(1), matches.group(2), matches.group(3) 

輸出:

string1 = string2 
string1 = string2 
string1 = string2 
string1 = string2 
string1 >= string2 
string1 >= string2 
string1 >= string2 
string1 < string2 
+1

你的正則表達式還會匹配包含非法操作符的'string1 << string2'和'string1 <> string2'。 – martineau

+1

這是更嚴格:'pat = re.compile(r'(\ w +)\ s *(= | <=|> = | <|>)\ s *(\ w +)')' –

+0

謝謝您的評論。我認爲輸入數據是有效的。無論如何,越嚴格的正則表達式越好。 –

1

您可以使用re.findall

>>> import re 
>>> s = "string1>=string2" 
>>> re.findall(r'\w+|[^\s\w]+', s) 
['string1', '>=', 'string2'] 
>>> re.findall(r'\w+|[^\s\w]+', 'string1 = string2') 
['string1', '=', 'string2'] 
>>> re.findall(r'\w+|[^\s\w]+', 'string1 >= string2') 
['string1', '>=', 'string2'] 
>>> re.findall(r'\w+|[^\s\w]+', 'string1 <string2') 
['string1', '<', 'string2']