2014-03-30 33 views
4

當我使用DOM得到該鏈接的內容從HTML獲取內容: link here顯示錯誤時使用DOM

我必須得到這個內容的HTML如下:

<div align="justify"> “…Và em muốn biết, nÆ¡i trái tim vẫn nhá»› thÆ°Æ¡ng âm thầm bao lâu nay /Sẽ mang đến cho mình Æ°á»›c mÆ¡ vá» hạnh phúc ấy /Hay là ná»—i xót xa, có hay /Rằng tình yêu em luôn bao la /Rá»「i sẽ tá»›i má»™t ngà y anh chợt nhận ra , tình ta nhÆ° đóa hoa đợi khi nắng mai /Khi đôi môi lại rạng rỡ , tình ta chẳng phai nhòa…â€â€「 giai Ä‘iệu ngá»t ngà o của má»™t ca khúc vang lên trong chÆ°Æ¡ng trình radio Ä‘ang phát sóng là m cô chợt chạnh lòng. Má»™t cảm giác vừa quen vừa lạ nhen lên nÆ¡i trái tim. Cô cố gắng lục lại trí nhá»› của mình: 30 giây! 1 phút! 2 phút! Chợt, mắt cô thoáng buá»「n, cảm xúc trong trái tim cô nhÆ° vỡ òa khi tất cả nhÆ° má»™t cuốn phim chạy chậm trong trí nhá»› cùng má»› cảm xúc há»—n Ä‘á»™n: Dòng thá»i gian trở vá» trong cuốn phim là những kỉ niệm cùng anh â€「 chà ng sÄ© quan hải quân. </div> 

雖然這個鏈接內容如下:

<div align="justify">1. Em không đẹp như các cô bạn gái trước đây của tôi. Em cũng không dịu dàng và nhìn tôi bằng ánh mắt trìu mến như họ. Em còn có một nhóc con đã ba tuổi, thằng bé dễ thương, kháu khỉnh và có đôi mắt buồn giống hệt mẹ. Em như một bông hoa dại cô độc, từng cánh hoa đơn trắng muốt, nhụy hoa vàng mềm mại, thân dài mảnh mai với những chiếc lá thanh mảnh, run rẩy nở trong gió nhưng không bao giờ cong gãy. Còn tôi, với đôi tay luôn được bao bọc trong lồng kính, lại tùy tiện ngắt hoa, không biết rằng trên đó có gai, cũng không hề biết rằng nó sẽ làm cho trái tim mình ứa máu. Đã hơn một lần tôi thổ lộ lòng mình với em nhưng đều nhận được ánh mắt lạnh lùng và lời từ chối phũ phàng:</div> 

我知道這裏有錯誤格式,但我無法修復它。我該如何解決這個問題?

這裏是我的代碼:

$link_mp3=$linkTemp.HadlingLink($html2->find('object#jwplayer param [name=flashvars]',0)->value); 
//echo $link_mp3.'<br/>'; 

$arrayContents=$html2->find('div[align=justify]'); 
//var_dump($content); 
$contents=''; 
foreach ($arrayContents as $content){ 
    $contents=$contents.$content->outertext; 
} 
echo $contents; 

當我改變痘痘代碼:

echo utf8_decode($contents); 

它顯示:新罕布什爾? cônàng?? ng ?? nh,??tát,?m m?ckiêuk? ng gi?a anhchàngmùa?ôngl?nhlùngvàanhchàngmùah? ?máp。

了日期:

我修好了我的probleam如下:加時獲取HTML使用curl

CURLOPT_ENCODING => "UTF-8", // handle all encodings 

。這裏是功能

static function get_web_page($url) 

    { 


     $options = array(
      CURLOPT_RETURNTRANSFER => true, // return web page 
      CURLOPT_HEADER => false, // don't return headers 
      CURLOPT_FOLLOWLOCATION => true, // follow redirects 
      CURLOPT_ENCODING => "UTF-8", // handle all encodings 
      CURLOPT_USERAGENT => "spider", // who am i 
      CURLOPT_AUTOREFERER => true, // set referer on redirect 
      CURLOPT_CONNECTTIMEOUT => 200, // timeout on connect 
      CURLOPT_TIMEOUT => 200, // timeout on response 
      CURLOPT_MAXREDIRS => 10, // stop after 10 redirects 
     ); 

     $ch = curl_init($url); 
     curl_setopt_array($ch, $options); 
     $content = curl_exec($ch); 
     $err = curl_errno($ch); 
     $errmsg = curl_error($ch); 
     $header = curl_getinfo($ch); 
     curl_close($ch); 

     $header['errno'] = $err; 
     $header['errmsg'] = $errmsg; 
     $header['content'] = $content; 
     return $header; 
    } 
+1

你可以發佈你的代碼嗎? –

+0

是的。 '$ link_mp3 = $ linkTemp.HadlingLink($ html2-> find('object#jwplayer param [name = flashvars]',0) - > value); \t // echo $ link_mp3。'
'; \t $ arrayContents = $ html2-> find('div [align = justify]'); \t // var_dump($ content); \t $ contents =''; ($ arrayContents as $ content){ \t \t $ contents = $ contents。$ content-> outertext; \t} \t echo $ contents;' – user2126005

+0

你可以發佈它的問題?這裏很難閱讀。 –

回答

0

在你的html頁面中使用下面的'meta'標籤。

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />