我有一個PHP preg_match函數實現,其中我將一個已知的RegEx與另一個變量的清理版本進行比較。我正在使用多個preg_replace等命令進行清理。我想知道是否有一種替代方法可以做到更小的(也許只涉及一個reg匹配)並且更快(匹配多次比一次只做一次更復雜)。將多個正則表達式(匹配和替換)組合成一個正則表達式;優化速度
這裏是我當前的代碼:
$url_regex_to_match = /SOME_REGEX/; //I will pick this from DB
$matches = array();
//Following to replace http://www.google.com into http://google.com
preg_match('/(http.?):\/\/(www\.)?(.*)/i', $url, $matches);
if(sizeof($matches)==4) {
$url = $matches[1]."://".$matches[3];
}
//Incase the preg_match is false (http is missing), we still need to remove www.
$url = preg_replace("/(^\*?|\/\/)www\./i","$1",$url);
//It converts google.com/a#mno into google.com/a
$url = preg_replace('/^(.*)(#.*)$/', '$1', $url);
//It converts pages like google.com/index.htm into google.com/
$url = preg_replace('/^(.*\/)((home|default|index)\..{3,4})(\?.*)*$/', '$1$4', $url);
//This will replace google.com/ into google.com
if(substr($url, -1) == "/") {
$url = substr($url, 0, -1);
}
//This is just to match the new URLs with the pattern I have
$boolean = preg_match($url_regex_to_match , $url);
布爾的期望值是ofcourse真/假。
謝謝
你可能會添加一些解釋預期結果的註釋嗎? –
對不起,我添加了一些評論。讓我知道如果你希望它更清晰 –
所以,你想提取URL的域名部分?您可能應該使用URL解析庫來代替試圖推出您自己的基於正則表達式的解決方案;有很多URL可能會讓你感覺不適。查看PHP的['parse_url()'](http://php.net/manual/en/function.parse-url.php)。 –