2016-11-28 81 views
-1

我使用的是simplehtmldom,我試圖從網站獲取所有鏈接。這是我的腳本:在網址上獲取%3F

include('simplehtmldom/simple_html_dom.php'); 

// get DOM from URL or file 
$html = file_get_html('http://example.com/urls/'); 

// find all a tags 
foreach($html->find('a') as $e) 
    echo $e->href . "\n"; 

什麼我得到是網址完整名單,但他們中的一些結束與%3F那裏是前人的精力字符串。喜歡的東西:

http://example.com/urls/%3F 

相反的:

http://example.com/urls/foo 

我做了一些研究,似乎修復需要在Apache服務器補題上完成用不上它,有什麼我可以做的,以解決它?

+0

%3F只是**?**的URL編碼版本......我懷疑這是在Apache中需要任何*「修復」*的東西。 – CD001

回答

1

剛剛解碼傳入的URL是這樣的:

echo urldecode($e->href)."\n"; 

它會給解碼後的URL字符串。

+0

保存了一天,謝謝! – sysfiend