我需要替換從另一個站點通過curl拍攝的頁面中的URL。我的PHP捲曲代碼是;preg_replace修改來自curl的URLs
<?php
$ch = curl_init ("http://www.externalwebsite.com/index.php");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$page = curl_exec($ch);
preg_match('#<div class="headline"[^>]*>(.+?)</div>#is', $page, $matches);
foreach ($matches as &$match) {
$match = $match;
}
$html=$matches[1];
$html = preg_replace('~a href="([a-z,.\-]*)~si', '"', $html); //NEED TO CHANGE THIS
echo $html;
?>
此代碼工作正常,直到url具有除id以外的任何數字字符。沒有任何preg_replace命令,這就是html的樣子。
<div class="swiper-slide red-slide">
<div class="title"><a href="http://www.externalwebsite.com/title-of-the-3-page-192345.htm" class="image">
<img src="http://www.externalwebsite.com/d/news/94406.jpg"/></a></div></div>
如果我使用上面的preg_replace命令,html看起來像;
<div class="swiper-slide red-slide">
<div class="title"><a href="http://www.mywebsite.com/read_curl.php?id=3-page-192345" class="image">
<img src="http://www.externalwebsite.com/d/news/94406.jpg"/></a></div></div>
Bu它必須是這樣的東西;
<div class="swiper-slide red-slide">
<div class="title"><a href="http://www.mywebsite.com/read_curl.php?id=192345" class="image">
<img src="http://www.externalwebsite.com/d/news/94406.jpg"/></a></div></div>
只有id必須保留,所有其他的東西必須刪除。有人可以幫我嗎?
更新:頁面的標題動態變化,最後6位是id,唯一的東西必須保留在url中。
你的2個碼看 –
更新相同的,我很抱歉。 – user2834975
檢查答案 –