我使用的file_get_contents,捲曲,簡單的HTML DOM,但不能從這個網址獲得HTML: http://www.zing.vn/news/xa-hoi/choang-voi-clip-cu-ba-cao-tuoi-nhay-boc-nhu-vu-cong/a124040.html爲什麼無法獲得此網址的HTML代碼?
我不知道爲什麼,但結果卻是雜亂無章的字符,而不是HTML代碼。
我使用的file_get_contents,捲曲,簡單的HTML DOM,但不能從這個網址獲得HTML: http://www.zing.vn/news/xa-hoi/choang-voi-clip-cu-ba-cao-tuoi-nhay-boc-nhu-vu-cong/a124040.html爲什麼無法獲得此網址的HTML代碼?
我不知道爲什麼,但結果卻是雜亂無章的字符,而不是HTML代碼。
您需要設置CURLOPT_ENCODING,如果是空的,捲曲將處理編碼本身而這正是你所需要的:)
我測試過下面的代碼,並返回正確的字符編碼。
$url ="http://www.zing.vn/news/xa-hoi/choang-voi-clip-cu-ba-cao-tuoi-nhay-boc-nhu-vu-cong/a124040.html";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch, CURLOPT_ENCODING,"");
$pagebody=curl_exec ($ch);
curl_close ($ch);
echo $pagebody;
是啊!使用CURLOPT_ENCODING,curl可以獲得該網址的HTML代碼。我的問題已解決!非常感謝Tuga!感謝每個機構都評論過來幫助我! – user895921
該網頁似乎總是返回gzip編碼的內容(即使客戶端不聲稱支持它)。您可以使用gzinflate
解碼壓縮的內容。
如果您發佈任何內容的前幾行,這將對您有很大的幫助,以便我們更好地理解您的意思是「隨意字符」。有些人理解你無法理解的任何東西(這就是爲什麼你在這裏發佈的問題,對吧?:)) – BalusC
看起來像我的常規源 – GBa
至少發佈一些你的代碼。只是說你使用的功能實際上是沒有足夠的信息。 –