我使用正則表達式對數據進行排序分組。線條看起來有點像正則表達式 - 跳過表情和解析其餘
testword test
test testword
tes.w. tes.
tes tes.w.
tes.w othertexttobefound
sometexttobefound testword somemoretextwhichdoesnotmatter
字test
要和發現的othertexttobefound
和sometexttobefound
。
現在我想告訴我的解析器,它應該清楚地忽略testword
及其衍生物,而搜索和專注於我的數據條目的其餘部分。 「好詞」和「壞詞」可以在每行中的任何地方。
我試圖[^w]
這是罰款字符串的開始,但在我的版本中沒有的其他案件。另外(?:w)
沒有做到這一點。我不能使用lookarounds,因爲這樣可以防止整條線被檢測到。
在這裏,我希望能爲幫助在互聯網上進行長時間搜索後!
預先感謝您!
Gerit
從Naxos84大加讚賞的幫助後,我加入了一些德國的現實生活中的例子:
sozialabgabe sozialarbeiter
soz.abg. sozialarbeiter
sozarbeiter soz.abg.
sozialarbeiter otherirrelevantstuff
otherirrelevantstuff soz abg
otherirrelevantstuff sozabg
otherirrelevantstuff sozialabgabe
如果我搜索與
sozial["^\ab"]|soz["^\ab"]|sometexttobefound|othertexttobefound
線6,7得到標記以及,但我不想要這些。
我在做什麼錯? 謝謝你的進一步提示。
鏈接: regexr
你說的是一個Perl程序或PCRE Perl的正則表達式引擎? – simbabque
要匹配整個單詞,請使用'\ b'作爲單詞邊界。例如:'/ \ BTEST \ B /'將匹配 「測試」,而不是 「testword」 或 「wordtest」 或 「wordtestword」。單詞邊界可能出現在行的開頭和結尾。 – shawnhcorey
@simbabque,有沒有這樣的事,作爲一個「PCRE Perl的正則表達式引擎」。我認爲你的意思是「PCRE正則表達式引擎」。 – ikegami