2011-11-10 143 views
-3

我想要報廢Facebook頁面(https://www.facebook.com/pages/PTSD/455847705426) 我發現這個腳本登錄到Facebook。Facebook頁面抓取

<?php 
$EMAIL = "[email protected]"; 
$PASSWORD = "facebookPassword"; 

function cURL($url, $header=NULL, $cookie=NULL, $p=NULL) 
{ 
$ch = curl_init(); 
curl_setopt($ch, CURLOPT_HEADER, $header); 
curl_setopt($ch, CURLOPT_NOBODY, $header); 
curl_setopt($ch, CURLOPT_URL, $url); 
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 0); 
curl_setopt($ch, CURLOPT_COOKIE, $cookie); 
curl_setopt($ch, CURLOPT_USERAGENT, $_SERVER['HTTP_USER_AGENT']); 
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0); 
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); 

if ($p) { 
curl_setopt($ch, CURLOPT_CUSTOMREQUEST, "POST"); 
curl_setopt($ch, CURLOPT_POST, 1); 
curl_setopt($ch, CURLOPT_POSTFIELDS, $p); 
} 
$result = curl_exec($ch); 

if ($result) { 
return $result; 
} else { 
return curl_error($ch); 
} 
curl_close($ch); 
} 

$a = cURL("https://login.facebook.com/login.php?login_attempt=1",true,null,"email=$EMAIL&pass=$PASSWORD"); 
preg_match('%Set-Cookie: ([^;]+);%',$a,$b); 
$c = cURL("https://login.facebook.com/login.php?login_attempt=1",true,$b[1],"email=$EMAIL&pass=$PASSWORD"); 
preg_match_all('%Set-Cookie: ([^;]+);%',$c,$d); 
for($i=0;$i<count($d[0]);$i++) 
$cookie.=$d[1][$i].";"; 

/* 
NOW TO JUST OPEN ANOTHER URL EDIT THE FIRST ARGUMENT OF THE FOLLOWING FUNCTION. 
TO SEND SOME DATA EDIT THE LAST ARGUMENT. 
*/ 
$page_html = cURL("https://www.facebook.com/pages/PTSD/455847705426",null,$cookie,null); 


?> 

現在變量$ page_html只有幾個帖子,而且他們是在非常複雜的代碼 我的問題是

  1. 我怎麼能得到的所有帖子。
  2. 是否有其他一些方法可以讓我獲得完整清晰的數據。
  3. 是否有某種方式可以讓所有帖子以json格式。

請告訴我是否有關於此的一些有用的教程或文章。

問候

+2

從[Facebook的條款和條件](https://www.facebook.com/terms.php):您不會收集用戶的內容或信息,或以其他方式訪問Facebook,使用自動方式(如收集機器人,機器人,蜘蛛或刮板)未經我們許可。 – Quentin

+0

不會幫你打破Facebook的服務條款。 – bkaid

回答

2

花一些時間閱讀developer documentation。您可以通過設置應用程序將所有帖子作爲JSON對象從頁面獲取,然後使用頁面訪問令牌查詢圖形api。