2012-09-07 297 views
-5

我正在開發一個應用程序,我需要從另一個源/網站獲取數據。我做了谷歌,並測試了一些選項,如file_get_contents /捲曲。很明顯,curl比file_get_contents快得多。從網站獲取數據

現在,我需要獲取的是一個特定的內容列表,如div內的項目列表。我想忽略頭信息/腳本/ CSS等只需要獲取數據,並在我自己的主題樣式。

請告訴我最好的方法/函數來獲取內容和風格的輸出。如果你能饒了某個時候,並提前

+0

也許你會在這裏找到答案:http://stackoverflow.com/questions/5045598/getting-elements-of-a-div-from-another-page -php :) – Ddorda

回答

0

我會使用HTML解析器。我用簡單的HTML DOM PARSERhttp://simplehtmldom.sourceforge.net/它很棒。也有一個很好的文檔。它給在其主頁這個例子:

// Create DOM from URL or file 
$html = file_get_html('http://www.google.com/'); 

// Find all images 
foreach($html->find('img') as $element) 
     echo $element->src . '<br>'; 

// Find all links 
foreach($html->find('a') as $element) 
     echo $element->href . '<br>'; 
0

一個方式你可以做到這一點是使用file_get_contents編寫一個基本的代碼將是非常有幫助...

感謝。

例子:

$fileHTML = file_get_contents('http://www.google.ca');
$title = substr($fileHTML,strpos($fileHTML,'<title>') + 7,strpos($fileHTML,'</title>') - (strpos($fileHTML,'<title>') + 7));
的+ 7,它會轉到<標題>
echo $title;
這應該顯示了谷歌網站的標題末尾。

這樣做的方式是通過抓取ID的方式,因爲在適當的網站中,所有的ID都是唯一的。

+1

「一切都有一個id是唯一的。」情況並非總是如此。使用DOM解析器 –