最近,我開始在我的Rails模型中使用來自JQuery validation插件的電子郵件驗證正則表達式。正則表達式在Ruby中與JavaScript相比表現不佳
EMAIL_REGEXP=/^((([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+(\.([a-z]|\d|[!#\$%&'\*\+\-\/=\?\^_`{\|}~]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])+)*)|((\x22)((((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(([\x01-\x08\x0b\x0c\x0e-\x1f\x7f]|\x21|[\x23-\x5b]|[\x5d-\x7e]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(\\([\x01-\x09\x0b\x0c\x0d-\x7f]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF]))))*(((\x20|\x09)*(\x0d\x0a))?(\x20|\x09)+)?(\x22)))@((([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|\d|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))\.)+(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])|(([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])([a-z]|\d|-|\.|_|~|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])*([a-z]|[\u00A0-\uD7FF\uF900-\uFDCF\uFDF0-\uFFEF])))$/i
"[email protected]".match EMAIL_REGEXP # returns immidiately
"[email protected]".match EMAIL_REGEXP # takes a long time
正則表達式採用當一個無效電子郵件已經許多圓點分隔的標記長的時間(延續:[email protected])。同樣的表達works without JavaScript中任何明顯的延遲。
爲什麼Ruby和JavaScript正則表達式解析器在性能上有這樣的差異?有什麼我可以做的,以提高響應時間?
我在Ruby 1.8.7上。我在Ruby 1.9.2上看不到相同的問題。
注意
我知道REG-EXP長。由於它被jQuery使用,我想過使用它。我可以隨時將其更改回更簡單的正則表達式,如here所示。我的問題主要是找出爲什麼同樣的正則表達式在JS中快得多的原因。
參考:
JQuery Validation Plugin Source
Sample form with jQuery email validation
這是一個巨大的正則表達式。你爲什麼不使用電子郵件解析器? – Blender
@如果你提供了一個鏈接,Blender的評論質量會大大提高 – tekknolagi
這個正則表達式來自官方的'jQuery'插件,它被廣泛使用。所以我認爲這是一條安全的路線。如果我無法使RegExp正常工作,我可能會走自定義驗證的路線。 –