正則表達式在引號之間捕獲字符串，特別是當字符串以引號開頭時

string= 'Sam007's Helsen007' is a 'good' boy's in 'demand6's6'.

我想提取引號內的字符串。

輸出應該看起來像，

['Sam007's Helsen007', 'good', 'demand6's6']

我已經寫在正則表達式：

re.findall("(?:[^a-zA-Z0-9]*')(.*?)(?:'[^a-zA-Z0-9*])", text)

但是這給輸出

["Sam007's Helsen007", 'good', "s in 'demand6's6"]

當我使用修改的正則表達式來

re.findall("(?:[^a-zA-Z0-9]')(.*?)(?:'[^a-zA-Z0-9*])", text)

它給我的輸出：

['good', "demand6's6"]

第二種情況似乎更合適，但如果一個字符串開始報價它不能處理的情況。

我該如何處理案件。

2015-11-06 Sam

st= "'Sam007's Helsen007' is a 'good' boy's in 'demand6's6'" 


print re.findall(r"\B'.*?'\B",st)

使用\B即non word boundary

輸出：["'Sam007's Helsen007'", "'good'", "'demand6's6'"]

如果您通過串仔細看你想要一個字符串'其中有之前的一個非字字符和'具有非字字符後。

2015-11-06 08:39:21 vks

好一個+1 .... –

@Uchiha thanx :) – vks

但我認爲你還應該添加一些解釋，這樣即使非正則表達式的用戶也許會明白你在做什麼 –

回答