2011-09-25 27 views
0

我從Curl/php開始,我非常喜歡它可以做的事情。雖然,我被封鎖了幾天,我真的需要幫助。如何從論壇主題獲取數據?

有一些特殊的數據需要用另一個腳本來抓取和處理,這要感謝txt文件。

數據是由我的論壇上發佈的代理,代表同意發佈在與論壇相關的外部網站上。

的代理正在這種形式

107.2.178.129:47535<br/>173.174.251.89:18785<br/>173.48.224.237:1807<br/>and so on ... 

我需要它們被放置在一個文本文件,每行一個代理。

這裏是我迄今爲止

<?php 


$ch = curl_init(); 

curl_setopt($ch, CURLOPT_URL, 'http://www.external-site.com/Members/Login.php'); 

curl_setopt ($ch, CURLOPT_POST, 1); 

curl_setopt ($ch, CURLOPT_POSTFIELDS, 
'fieldname1=fieldvalue1&fieldname2=fieldvalue2'); 

curl_setopt ($ch, CURLOPT_COOKIEJAR, 'cookie.txt'); 

curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1); 

$store = curl_exec ($ch); 

curl_setopt($ch, CURLOPT_URL, 
'http://www.external-site.com/index.cgi?action=display&thread=26'); 

$content = curl_exec ($ch); 

curl_close ($ch); 

?> 

在那之後我被困。

+1

爲什麼你不要求網站的所有者提供一些方便的格式的數據? – zerkms

回答

3

所以,你已經獲得論壇帖子文本?假設$content是有效的:

file_put_contents('proxies.txt', implode('\n', explode('<br/>', $content))); 

使用\n在Linux或\r\n在Windows上。