我有一個very_largeString
包含單詞的列表,以及一些id
,我想提取所有的話,它的id
有NC
和AQ
是形態ocurre consecutevely和打印id
的其餘部分。例如:如何解決這個正則表達式以捕獲字符串的特定字符?
very_largeString= ''' Hola hola I 1
compis compis NCMS000 0.500006
! ! Fat 1
esta este DD0FS0 0.986779
y y CC 0.999962
es ser VSIP3S0 1
que que CS 0.437483
es ser VSIP3S0 1
muy muy RG 1
sencilla sencillo AQ0FS0 1
de de SPS00 0.999984
utilizar utilizar VMN0000 1
, , Fc 1
que que CS 0.437483
si si CS 0.99954
nos nos PP1CP000 0.935743
ponen poner VMIP3P0 1
facilidad facilidad NCFS000 1
con con SPS00 1
las el DA0FP0 0.970954
tareas tarea NCFP000 1
de de SPS00 0.999984
la el DA0FS0 0.972269
casa casa NCFS000 0.979058
pues pues CS 0.998047
mejor mejor AQ0CS0 0.873665
que que PR0CN000 0.562517
mejor mejor AQ0CS0 0.873665
, , Fc 1
pero pero CC 0.999764
tan tan RG 1
antigua antiguo AQ0FS0 0.953488
que que CS 0.437483
según según SPS00 0.995943
mi mi DP1CSS 0.999101
madre madre NCFS000 1
era ser VSII1S0 0.491262
de de SPS00 0.999984
carga carga NCFS000 0.952569
superior superior AQ0CS0 0.992424
'''
這將是所需的輸出,因爲他們有一個在id
的開頭的NC
和AQ
字符:
[('carga', 'NCFS000', 'superior', 'AQ0CS0'), ('carga', 'NCFS000', 'frontal', 'AQ0CS0')]
如何解決我的正則表達式,以提取所有作爲編號的文字編號爲AQ
和NC
?這是我所有準備嘗試:
regex_ = re.findall(r'^(\w+)\s\w+\s(NCFS000)\s[0-9.]+\n^(\w+)\s\w+\s(AQ0CS0)', very_largeString, re.M)
print regex_
輸出就是單詞和it's例如相關id
:
[('word','id'),('word','id')]
那麼你的期望輸出將不匹配實際的輸出,我猜你沒有列出你的輸出的其他組合? – hwnd 2014-10-27 20:01:24
我只想專注於所有具有NC和AQ作爲id的單詞並且一個接一個地出現(即沒有空格,沒有其他單詞和ID) – 2014-10-27 20:03:38