我想寫一個正則表達式,將一個字符串計數的次數在一定距離內兩個詞同時出現(在彼此的5個字)兩個詞,沒有重複計算的話。Java正則表達式查找發生併攏
舉例來說,如果我有一個字符串:
「男人喜歡他的大帽的帽子是非常大的。」
在這種情況下,正則表達式應該在第一句中看到「大帽子」,在第二句中看到「帽子大」,總共返回2個。注意,在第二句中,有「帽子」和「大」之間的幾個單詞,它們也會出現在不同的順序的第一句話,但他們仍然有5字窗口內發生。
如果正則表達式是不是解決這個問題的正確方法,請讓我知道我應該嘗試來代替。
我正在考慮這樣的事情,但它似乎有點蠻力十歲上下,我也相信它最終會重複計算一些字。 –