2017-07-03 23 views
2

我正在嘗試構建一個python腳本,它可以在BeautifulSoup的網頁中查找單詞/術語。我需要它,以便用戶放入術語的連字符或非連字符版本,並且它將檢查兩者,例如「數據驅動」也檢查「數據驅動」。選擇帶有正則表達式的連字符或非帶連字符的版本

如果我有這樣的文字:

Slaying the ‘old school’ bosses with data-driven platforms. 

Slaying the ‘old school’ bosses with data driven platforms. 

而正則表達式:

(.+(\W(data((-)|(\s))driven)\W).+) 

然後,它只是抓住了連字符的版本,而不是非連版本。

我該如何修改它才能正常工作?我正在看它http://regexr.com/

+1

該表達式似乎在兩種情況下都適用於我。 – FamousJameous

+0

Ach - 我沒有選擇「全局」...你是對的! –

回答

0

您的模式捕獲了連字符和非連字符,所以問題是什麼?我不知道你的模式的原因,但對我來說看起來很複雜。這個簡單的怎麼樣?

data[- ]driven 
+0

你說得對,我沒有選擇全局。此外,更好,更簡單的版本謝謝。 –

相關問題