1
我在長約3000個字符的文本塊上運行多管道正則表達式。我有6個不同的比賽總是相對於彼此相同的順序和複雜這是我一直想現在是最後一個firsst在正則表達式中優化或管道(|)
Pattern1|Pattern2|Pattern3|Pattern4|Pattern5|Pattern6
優先考慮我測試是發現樣式1文本塊。獨立需要41個步驟,在管道中需要30,000多個。我知道這可能需要更具體的信息來解決這個特定的問題,但是想知道是否有一些通用的步驟可以使管道和/或管道更有效率。有沒有一個「訂單」有幫助?顯然,這並不是測試第一種模式,然後退出,因爲它仍然是41步,所以想知道我是否需要堅持一些我不知道的基本和/或構造。
我想公平的第一個問題是:爲什麼你使用這個正則表達式? – usr2564301
是的,基本的是,模式是在每個分支(而不是整個分支的分支)在字符串中的每個位置(從左到右)進行測試。 –
我不完全瞭解您的個人正則表達式是如何相關的,但是您可以將它們分解爲獨立搜索嗎?如果是這樣,那麼您可以使用多處理模塊來設置工作進程,每個進程只搜索其中一個術語。也許某些後期處理可能會將結果組織爲您需要的格式。我不知道任何方式來再次簡化給定的正則表達式。 – skrrgwasme