2015-04-05 27 views
-2

我想解析kickass的洪流頁面。但是,當我嘗試使用get_html_contents解析它時,它會迴避一些不可理解的內容。 這裏是我的代碼:get_html_contents不返回源

<?php 
    include('simple_html_dom.php'); 
    $opts = array(
       'http'=>array(
      'method'=>"GET", 
      'header'=> 
        "Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8\r\n". 
        "Accept-language: en-US,en;q=0.5\r\n" . 
      "User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6\r\n". 
      "Cookie: foo=bar\r\n" 
       ) 
    ); 
    $context = stream_context_create($opts); 
    $html = file_get_html("http://kickass.to/",false,$context); 

    echo $html; 
?> 

這是我得到的輸出:

‹í}kwÛ8²àçίÀh¶'öM ñ-)‰Ýëgâ‰dlwÒ}½™> IŒ)R͇dgzî9»_öíÇ=ûîýK[zÙ」 ›–  
2}:3mI$P P¨ …WÚ¿wþó‡ÒOþö「WøA®~oÕúI2|ÑhŒÇãúX¯‡Q¯¡¶ÛíÆ–©×‹¶j~Õ°³Ýí'þ½ 
°Ä&X「²_So´UÛƒ„ =¿²qį­Z®’BzIœ¾Å,ÙJ「.mÕw:K®}v+8'Žç«ö€mÕ 
\;‘7L¼0˜©qÆìÈé;p•ØIã˜lÌwíQy #çIÜÇ1ùÿÊ"ÅÏÉ ‰Ï4ö^¡xâúwâ%>ÛÞÇÚ.9£PÆurhÇ  
¯p1–?'yÁ˜PòÖs.í8Ϋ¼jX®ï—$bþV-Æ6ˆûŒ%5’@KÌ4éG¬»Uk4Nb'žSwÂAÃö}ÚÕµ¦á°:/•7zM 
´:iÜÄÑ£ÄIâ9Øp·‚õvÅ h0,T‡?HOáÙÃ!ô[¦NŸÞ r±t}ô8löO」^x][email protected]šŸg) 
¿$0ÜðXs¾îjǼAþtÁ×ë~¦ô&îVYÜ­Špú ¢mçh…\「8rnàýóÑeÖ^0aüK<‡ò‹=²ˆÚö«†øv=³$ÜÅyûá­ 
>êøÿFvD.í„l‘Lžá[email protected]Àì˜ýâ¹/ÈÓõÓçsE\–0'ùÅ·ƒÞ¢Ì¿‹‡vÄ~q|†/ˆš?ýçKAÄ|-oýÙW¾Ýg†‹Ÿ° 
(°–WÅá96ª±FÇÏ®PsõÊ,í ˜#IHNÏÎH—1w2À~€â[jÞ¶‹êqj­{MGêŒrüÙqÞ5¼ZëÌë¾ywpø³•¶5O  
S=Ùa½¿í]jï¯ßÿõx¨ÂƬCáuì¡ÝñgçÂkO¹¿«: mÓŽQ>,gàt|Û¹¤Id±Ÿ:ðh 5ý™Æ±ùKìü ƒ「üö¹øür"é¯Â^xÕ Ýkøp½ñÜ­Ú8‚ÇÂ㣠àï&ÏVR[Žk°–«µºV·Ó´ºL7X»ã¶£ÝÂÁ…g«èmæ@1×5Ì&3mG×›PÉíªª©(®iMªÌQà‡=´Ñhþ-2Á¢í'ß½ lQnÀ‚(üî»Wv.µ@ˆ•mþÒãÏаxã¹, ÇñÚª]Ú Öè×0Ôï­šúaô‚ü¹ƒ§c¼$]è &_Ù¢Ã+xÖCòÂgÝä%é3¯×O^SÁ7 ûŒÎ=B2#ù#:ˆ{$ÍÔÄw「ÙW 3‡‘„Ã「¸Çû/#¬ûÆ|óÁªuƒjæÜ8áÝÔð½Y,KÁ¯ KüpŒ„#–^|ËRɨ4ðó2€¹S_Ò Læ©Ç§28¸‡T„´Eâ½xÃk¬ ƒ¡†—…ðåÀŽ.ì],*{ÆTbbg8」ÃxVº—w°´ø0鳨Ôx%oË\]]wªaý§Ÿ~ºö«Fêgº){>ý2¯[email protected]©ÒÀK®oÓ@「—KuФԂBL32÷M†(˜Ó³ýP€b*Ï@ŸcfŠ¢kÿzxZÃáÎßnE¹¥é`Nì7¸=s×t…dÀÄ¿œ‚SÖóbðSHƒœy½€·」uì«Ì,`Œ5rÃIØeÌa atÓdKìžã‡©;¡vòANøÊ,Ui)ÃÆlY£¶ÍŠ¾QASTc±<>+.nÎW^Þ,(¯»s¥õÚ¶î5•ï5%îCÓÄð%ìŸ^Ä®çêkµmS!¢ Á‡à@}F ²xC÷ó€òD¼.ÀÌë¹7*‹ÇE•"˜áoTÁ‡: ;Y¤:à5#Åvê/6œ(C°Á÷ p-/ìËп^„0óª r×xþ5¶|z£áÅ;oŠ*{Ýäúî>BxÉrÝ؃õ%ð¬¨8Š7Êãâ ó¹e?O ZP§òœ»¤…»‹ cÙë"@0ÙƒuùÓ‚*}ôÃæj€ËÆUA‡åÔ:väÞ •—@bùÛ08"(:ß·ç’YÛž}WT=±›þ’=1À¡ÆU° ·HsV„L €º„·0È/–oì: OøÛ" hÕìàFåìyA5?y˃;ôðK[U‘'ÔH3ÊÉ Óy…ݬmóªDT$P€–š¨+¬Pˆ2N8 Glpgëïø²ÈuàÚ‹¼ò‡rþÆ`bßßR%`_ÓE1ÂgEÅýEèA‘ú§Û:†¼qˆr「r¾:–"X† w;(jŠUÞb]þ°¨óÓ^z£ZT¥·82’"i›øÇÿ‚lpýÃÂèz±)á)bQd9H\èòÁ¹A9Ê_.:9îßV¿XZõ‹\ÝVŸ/­PÜ|ñþ†·É­T`Q t9/´ðØöqpÃ7LµÅщð²ßK€ÂÙQ1o#p 2Ò@Ù‚gÞ—švàÍàtÍ´$ d8$ø¼ â’Öc²DKaþ Çh14qè|Ó‹¹‹Ê++FšdR¤àµ×½¾a¥âÃ%åó­Æ3¾#Ë,è¬rS+¨‹/xÕܲ·óB¸8i*`{:|—uF0ÚÂf¢ž‚Ë[{ÙòVØëùìÜîÅ|Á—¾²u³¾ç22õæ|\$mqàµí¿üùJ3wµ—³¾Þ¬ï1°½`£"[y~ò*Áu2öܤ¿USå{`æw¨í@_nÕñ{h»îäw¶t¦P_rÜII"î%îDáªõµíiƒ} ¤vcAI,‘éž°Í=º¬8£1¸^Ð(Ðn¸ìúh,pæÀd{@yÓ9vÂz ÅF 
+0

您需要完成該頁面的代碼? – 2015-04-05 16:16:15

+0

是的!!我需要獲得torrent下載鏈接。 – Torrezzzz 2015-04-05 16:16:43

+0

@Testing:有沒有辦法做到這一點/ – Torrezzzz 2015-04-05 16:48:48

回答

-1

在這裏你去,它會像一個魅力的你:

<?php 
    $html = gzdecode(file_get_contents('http://kat.ph')); 
    preg_match_all('/https?\:\/\/[^\" ]+/i', $html, $links); 
    var_dump($links); 
+0

wats de gzdecode和preg_match_all的使用? – Torrezzzz 2015-04-05 17:22:02

+0

** gzdecode **解碼壓縮的內容,並且我使用** preg_match_all **使用**正則表達式檢查內容中的所有鏈接** – 2015-04-05 17:38:42

+0

您認爲它滿足OP的要求嗎? – 2015-04-05 17:59:50