爲什麼無法獲得此網址的HTML代碼？

我使用的file_get_contents，捲曲，簡單的HTML DOM，但不能從這個網址獲得HTML： http://www.zing.vn/news/xa-hoi/choang-voi-clip-cu-ba-cao-tuoi-nhay-boc-nhu-vu-cong/a124040.html 爲什麼無法獲得此網址的HTML代碼？

我不知道爲什麼，但結果卻是雜亂無章的字符，而不是HTML代碼。

來源

2011-08-16 user895921

如果您發佈任何內容的前幾行，這將對您有很大的幫助，以便我們更好地理解您的意思是「隨意字符」。有些人理解你無法理解的任何東西（這就是爲什麼你在這裏發佈的問題，對吧？:)） – BalusC

看起來像我的常規源 – GBa

至少發佈一些你的代碼。只是說你使用的功能實際上是沒有足夠的信息。 –

您需要設置CURLOPT_ENCODING，如果是空的，捲曲將處理編碼本身而這正是你所需要的:)

我測試過下面的代碼，並返回正確的字符編碼。

$url ="http://www.zing.vn/news/xa-hoi/choang-voi-clip-cu-ba-cao-tuoi-nhay-boc-nhu-vu-cong/a124040.html"; 

$ch = curl_init(); 
curl_setopt($ch, CURLOPT_URL, $url); 
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); 
curl_setopt($ch, CURLOPT_ENCODING,""); 
$pagebody=curl_exec ($ch); 
curl_close ($ch); 

echo $pagebody;

來源

2011-08-16 03:28:51

是啊！使用CURLOPT_ENCODING，curl可以獲得該網址的HTML代碼。我的問題已解決！非常感謝Tuga！感謝每個機構都評論過來幫助我！ – user895921

該網頁似乎總是返回gzip編碼的內容（即使客戶端不聲稱支持它）。您可以使用gzinflate解碼壓縮的內容。

來源

2011-08-16 03:16:09 icktoofay

爲什麼無法獲得此網址的HTML代碼？

回答

相關問題