我需要尋找我的語料庫的詞語,如遊戲或羞恥的話但我想以指定搜索排除三串遊戲/一個恥辱或者, 一種遊戲/甲恥辱和一/一個/ A /的WORD遊戲或一/一個/ A /的WORD恥,其中WORD是改性劑,例如,好的遊戲或一個偉大的恥辱 。正則表達式回顧後 - 不包括從搜索
如果有人能幫助我,那會很好,謝謝!
在我的文集,不定冠詞一/一個和遊戲或一/一個和恥辱是最常用偉大和真正之間可選的詞。所以即使排除這兩個,也會對我有很大的幫助。
下面的回顧後工作完全排除A/A
(?<!a\s|A\s)\bshame\b
要排除修改WORD,我試圖用\ W在回顧後grep的,但它只是不工作? - grep下面沒有?運行,它仍然不包括例子比如恥辱,但它仍然返回這樣的不希望的例子作爲極大的恥辱或奇恥大辱 - 見一致性線(3)和(4)在下面的示例文本:
(?<!a\s|A\s|a\b\w\b|A\b\w\b)\bshame\b
我用來實現正則表達式的工具是AntConc,它支持Perl正則表達式。
示例文本使用下面
(?<!a\s|A\s)\bshame\b
1的搜索字符串(匹配恥辱)
,人們從場邊瞟後兩分不相干的例子(3 & 4)。 & nbsp;如果你想仔細觀察,你必須響起來進入並等待被接納。 & nbsp;我想我和索爾不會感到羞恥(或者只是知道我們的銀行賬戶以硬通貨的好處),因爲我們徘徊不前。 & nbsp;很多很多精品店和精心設計的時尚商店,都有音樂響起。 & abbutterflie.txt 47 1
2(比賽恥辱)
過去二十多年,我已經經歷了各種biggotry,但我認真地想過,反納粹主義黑足球沃斯的事過去。你應該全都慚愧,一堆[badword]。 adamdphillips.txt 57 1
3(不匹配恥辱)
我金錢,因爲我沒有那麼接近她,但她是非常要好的朋友跟另外一個女孩,它搞砸爲他們提供了一點,這是一個很大的恥辱。無論如何,霍莉和我後來在我們兩個人身上發現了一個地方。這將花費了一大筆錢,我要去上aderyn.txt是吃豆基礎60 1
4(不匹配恥辱)
是相當令人滿意的帶出的負載在那裏,上下搖擺不定的國家,因爲沒有人可以想出如何推銷它們,這是一種令人痛心的恥辱。有藝術家在那裏像< a href =「http://www.angelsintheabattoir.com/」rel =「nofollow」> Thea Gilmore </a > and < a href =「http://blog.amandapalmer.net/ 「相對=」 nofollow 「>阿曼達 - 帕爾默& aderyn.txt 60 2
5(比賽恥辱)
/> < BR/>」 有沒有更好的時間來證明這些恐怖分子,我們不要害怕他們,相反我們被強迫,通過我們的上級的懦夫行爲或者隱藏在羞恥之中。「 < br/> < br/>但佛羅里達州李縣的高中顧問Herb Wiseman指出7月7日倫敦爆炸事件。 < BR/> < BR/>「如果孩子因爲可變長度負lookbehinds不允許在aggy91.txt 64 1
你有這些詞的列表?因爲沒有「排除形容詞」之類的東西。你能否以預期的結果發表一個簡短的例子? – colburton
@colburton如果你編譯了每個形容詞的硬編碼列表,可能會有這樣的情況:p – Alexander
這是什麼語言?根據不同的語言,可能會或可能不支持可變長度的外觀。 –