2013-04-18 70 views
2

我有一長串由分號分隔的文本,所以我有一個正則表達式捕獲[^\;]+。但是,由於內容包含HTML撇號('),因此很麻煩。正則表達式爲X或不是Y

如何才能寫出一個正則表達式來捕獲除了分號以外的所有內容,除非分號是HTML撇號的一部分?

+4

爲什麼不解析HTML? – Blender

+5

我發誓,如果我有一個鎳每一次... http://stackoverflow.com/q/1732348/576139 –

+0

你不能。這不是正則表達式的用途。 –

回答

4
(&\S+?;|[^;])+ 

匹配HTML實體,就好像它們是單個字符一樣。

+0

這看起來很有希望 - 謝謝! – thumbtackthief

相關問題