2012-10-14 95 views
26

我有一些PHP捲曲和餅乾驗證的問題。PHP捲曲和餅乾

我有一個文件Connector.php它驗證另一臺服務器上的用戶並返回當前用戶的cookie。

問題是我想通過curl驗證數千個用戶的身份,但它一次僅爲一個用戶驗證並保存COOKIES。

爲connector.php代碼是這樣的:

<?php 
    if(!count($_REQUEST)) { 
     die("No Access!"); 
    } 


    //Core Url For Services 
    define ('ServiceCore', 'http://example.com/core/'); 


    //Which Internal Service Should Be Called 
    $path = $_GET['service']; 


    //Service To Be Queried 
    $url = ServiceCore.$path; 

    //Open the Curl session 
    $session = curl_init($url); 

    // If it's a GET, put the GET data in the body 
    if ($_GET['service']) { 
     //Iterate Over GET Vars 
     $postvars = ''; 
     foreach($_GET as $key=>$val) { 
      if($key!='service') { 
       $postvars.="$key=$val&"; 
      } 
     } 
     curl_setopt ($session, CURLOPT_POST, true); 
     curl_setopt ($session, CURLOPT_POSTFIELDS, $postvars); 
    } 


    //Create And Save Cookies 
    $tmpfname = dirname(__FILE__).'/cookie.txt'; 
    curl_setopt($session, CURLOPT_COOKIEJAR, $tmpfname); 
    curl_setopt($session, CURLOPT_COOKIEFILE, $tmpfname); 

    curl_setopt($session, CURLOPT_HEADER, false); 
    curl_setopt($session, CURLOPT_RETURNTRANSFER, true); 
    curl_setopt($session, CURLOPT_FOLLOWLOCATION, true); 

    // EXECUTE 
    $json = curl_exec($session); 
     echo $json; 
    curl_close($session); 
?> 

這裏是認證過程:

  1. 用戶輸入用戶名和密碼:Connector.php服務=登錄& USER_NAME = user32 & user_pass = 123
  2. Connector.php?service = logosessionInfo這會返回有關基於先前使用登錄服務保存的cookie的用戶信息。

問題是,這段代碼將Cookie保存在一個文件中供一個用戶使用,並且無法處理多個用戶身份驗證。

+2

我解決了我的問題,爲不同用戶提供獨特的PHPSESSID創建不同的cookie文件。 '$ tmpfname = dirname(__ FILE __)。'/'。$ _ COOKIE ['PHPSESSID']。'。txt';' – Shark

+0

如果有很多用戶,這是一個好主意嗎? – trainoasis

+0

否如果你有很多用戶,這是不好的。它導致Apache服務器崩潰。我用apache代理解決了這個問題。並刪除我所有的CURL代碼。 – Shark

回答

0

解決方案,甚至具有獨特的CookieFile名,會造成很多規模問題。

我們不得不爲這個解決方案提供很多認證,並且由於高文件讀寫操作導致服務器關閉。

解決方案是使用Apache Reverse Proxy並忽略CURL請求。

詳細介紹如何使用代理服務器在Apache可以在這裏找到: https://httpd.apache.org/docs/2.4/howto/reverse_proxy.html

22

您可以使用捲曲選項指定cookie文件。您可以爲每個用戶使用一個獨特的文件。

curl_setopt($curl_handle, CURLOPT_COOKIESESSION, true); 
curl_setopt($curl_handle, CURLOPT_COOKIEJAR, uniquefilename); 
curl_setopt($curl_handle, CURLOPT_COOKIEFILE, uniquefilename); 

來處理這將是堅持你的請求邏輯成捲曲功能,只是作爲一個參數傳遞的唯一文件名的最好方法。

function fetch($url, $z=null) { 
      $ch = curl_init(); 

      $useragent = isset($z['useragent']) ? $z['useragent'] : 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:10.0.2) Gecko/20100101 Firefox/10.0.2'; 

      curl_setopt($ch, CURLOPT_URL, $url); 
      curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); 
      curl_setopt($ch, CURLOPT_AUTOREFERER, true); 
      curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); 
      curl_setopt($ch, CURLOPT_POST, isset($z['post'])); 

      if(isset($z['post']))   curl_setopt($ch, CURLOPT_POSTFIELDS, $z['post']); 
      if(isset($z['refer']))  curl_setopt($ch, CURLOPT_REFERER, $z['refer']); 

      curl_setopt($ch, CURLOPT_USERAGENT, $useragent); 
      curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, (isset($z['timeout']) ? $z['timeout'] : 5)); 
      curl_setopt($ch, CURLOPT_COOKIEJAR, $z['cookiefile']); 
      curl_setopt($ch, CURLOPT_COOKIEFILE, $z['cookiefile']); 

      $result = curl_exec($ch); 
      curl_close($ch); 
      return $result; 
    } 

我用它來快速抓取。它需要url和一系列選項。

+0

謝謝,解決了我的問題! – user3236289

1

您可以使用CURLOPT_COOKIEFILECURLOPT_COOKIEJAR爲每個用戶定義不同的Cookie。爲每個用戶製作不同的文件,這樣每個用戶都可以在遠程服務器上擁有自己的基於Cookie的會話。

+0

什麼時候這個網頁被很多用戶使用(10萬以上)?這不是服務器上的巨大負載嗎? – trainoasis

10

首先使用的tempnam創建臨時cookie()函數:

$ckfile = tempnam ("/tmp", "CURLCOOKIE"); 

不是執行卷曲的init女巫的cookie保存爲臨時文件:

$ch = curl_init ("http://uri.com/"); 
curl_setopt ($ch, CURLOPT_COOKIEJAR, $ckfile); 
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, true); 
$output = curl_exec ($ch); 

或訪問cookie數據哪裏是臨時數據存儲區:

$ch = curl_init ("http://somedomain.com/cookiepage.php"); 
curl_setopt ($ch, CURLOPT_COOKIEFILE, $ckfile); 
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, true); 
$output = curl_exec ($ch); 

這會加載cookie初始化的頁面:

curl_setopt ($ch, CURLOPT_COOKIEFILE, $ckfile); 
+0

如果大量用戶試圖一次訪問該頁面,並且您已在/ tmp中擁有一些文件,那麼情況如何? PHP文檔說: 注意:如果PHP無法在指定的dir參數中創建文件,它將回退到系統默認值。在NTFS上,如果指定的目錄包含超過65534個文件,也會發生這種情況。 – trainoasis

+0

刪除cookie文件,如果存儲時間超過24小時。將$ ckfile的cookie數據單獨存儲以檢查/ tmp中的所有文件。 –

+0

3年後,對於像我這樣的非PHP人來說,您仍然是一名救生員Marin。在經歷了一堆stackoverflow答案後,這裏有一個很好地解釋了一個有序的方式。 –

20

在處理類似的問題時,我在組合了我在網上遇到的大量資源並添加了自己的cookie處理後創建了以下函數。希望這對其他人有用。

 function get_web_page($url, $cookiesIn = ''){ 
     $options = array(
      CURLOPT_RETURNTRANSFER => true,  // return web page 
      CURLOPT_HEADER   => true,  //return headers in addition to content 
      CURLOPT_FOLLOWLOCATION => true,  // follow redirects 
      CURLOPT_ENCODING  => "",  // handle all encodings 
      CURLOPT_AUTOREFERER => true,  // set referer on redirect 
      CURLOPT_CONNECTTIMEOUT => 120,  // timeout on connect 
      CURLOPT_TIMEOUT  => 120,  // timeout on response 
      CURLOPT_MAXREDIRS  => 10,  // stop after 10 redirects 
      CURLINFO_HEADER_OUT => true, 
      CURLOPT_SSL_VERIFYPEER => true,  // Validate SSL Certificates 
      CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1, 
      CURLOPT_COOKIE   => $cookiesIn 
     ); 

     $ch  = curl_init($url); 
     curl_setopt_array($ch, $options); 
     $rough_content = curl_exec($ch); 
     $err  = curl_errno($ch); 
     $errmsg = curl_error($ch); 
     $header = curl_getinfo($ch); 
     curl_close($ch); 

     $header_content = substr($rough_content, 0, $header['header_size']); 
     $body_content = trim(str_replace($header_content, '', $rough_content)); 
     $pattern = "#Set-Cookie:\\s+(?<cookie>[^=]+=[^;]+)#m"; 
     preg_match_all($pattern, $header_content, $matches); 
     $cookiesOut = implode("; ", $matches['cookie']); 

     $header['errno'] = $err; 
     $header['errmsg'] = $errmsg; 
     $header['headers'] = $header_content; 
     $header['content'] = $body_content; 
     $header['cookies'] = $cookiesOut; 
    return $header; 
} 
+0

非常有用的代碼。有用。謝謝。如果人們想要HTTP狀態代碼,請使用以下語法:$ header ['http_code']; – jedema

+0

@Doug,我已經在[here](https:// regex101)中檢查了正則表達式##Set-Cookie:\\ s +(? [^ =] + = [^;] +)#m' .com/r/dU3nD8/1),正則表達式引擎將此部分解釋爲'\\ s +':'\\'匹配字符\字面意思 's +'與字符字面匹配(區分大小寫) - 不是它在這部分正則表達式中是錯誤的,它不應該是'\ s +'(只有一個反斜槓)嗎? –

+2

@Igor,\ \是因爲在PHP中處理字符串時[\被視爲轉義字符](http://php.net/manual/en/language.types.string.php)。因此,您需要兩個斜線以相等於評估字符串中的一個斜線(然後將用於RegEx匹配)。您從RegEx的角度來看是正確的,我只想要一個斜槓。 – Doug

2

在這裏您可以找到有關捲曲&餅乾http://docstore.mik.ua/orelly/webprog/pcook/ch11_04.htm一些有用的信息。

您也可以使用這個做得好方法https://github.com/alixaxel/phunction/blob/master/phunction/Net.php#L89像一個函數:

function CURL($url, $data = null, $method = 'GET', $cookie = null, $options = null, $retries = 3) 
{ 
    $result = false; 

    if ((extension_loaded('curl') === true) && (is_resource($curl = curl_init()) === true)) 
    { 
     curl_setopt($curl, CURLOPT_URL, $url); 
     curl_setopt($curl, CURLOPT_FAILONERROR, true); 
     curl_setopt($curl, CURLOPT_AUTOREFERER, true); 
     curl_setopt($curl, CURLOPT_RETURNTRANSFER, true); 
     curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false); 
     curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false); 

     if (preg_match('~^(?:DELETE|GET|HEAD|OPTIONS|POST|PUT)$~i', $method) > 0) 
     { 
      if (preg_match('~^(?:HEAD|OPTIONS)$~i', $method) > 0) 
      { 
       curl_setopt_array($curl, array(CURLOPT_HEADER => true, CURLOPT_NOBODY => true)); 
      } 

      else if (preg_match('~^(?:POST|PUT)$~i', $method) > 0) 
      { 
       if (is_array($data) === true) 
       { 
        foreach (preg_grep('~^@~', $data) as $key => $value) 
        { 
         $data[$key] = sprintf('@%s', rtrim(str_replace('\\', '/', realpath(ltrim($value, '@'))), '/') . (is_dir(ltrim($value, '@')) ? '/' : '')); 
        } 

        if (count($data) != count($data, COUNT_RECURSIVE)) 
        { 
         $data = http_build_query($data, '', '&'); 
        } 
       } 

       curl_setopt($curl, CURLOPT_POSTFIELDS, $data); 
      } 

      curl_setopt($curl, CURLOPT_CUSTOMREQUEST, strtoupper($method)); 

      if (isset($cookie) === true) 
      { 
       curl_setopt_array($curl, array_fill_keys(array(CURLOPT_COOKIEJAR, CURLOPT_COOKIEFILE), strval($cookie))); 
      } 

      if ((intval(ini_get('safe_mode')) == 0) && (ini_set('open_basedir', null) !== false)) 
      { 
       curl_setopt_array($curl, array(CURLOPT_MAXREDIRS => 5, CURLOPT_FOLLOWLOCATION => true)); 
      } 

      if (is_array($options) === true) 
      { 
       curl_setopt_array($curl, $options); 
      } 

      for ($i = 1; $i <= $retries; ++$i) 
      { 
       $result = curl_exec($curl); 

       if (($i == $retries) || ($result !== false)) 
       { 
        break; 
       } 

       usleep(pow(2, $i - 2) * 1000000); 
      } 
     } 

     curl_close($curl); 
    } 

    return $result; 
} 

而且通過這爲$cookie參數:這是上述

$cookie_jar = tempnam('/tmp','cookie');