我正在開發一個應用程序,我需要從另一個源/網站獲取數據。我做了谷歌,並測試了一些選項,如file_get_contents /捲曲。很明顯,curl比file_get_contents快得多。從網站獲取數據
現在,我需要獲取的是一個特定的內容列表,如div內的項目列表。我想忽略頭信息/腳本/ CSS等只需要獲取數據,並在我自己的主題樣式。
請告訴我最好的方法/函數來獲取內容和風格的輸出。如果你能饒了某個時候,並提前
我正在開發一個應用程序,我需要從另一個源/網站獲取數據。我做了谷歌,並測試了一些選項,如file_get_contents /捲曲。很明顯,curl比file_get_contents快得多。從網站獲取數據
現在,我需要獲取的是一個特定的內容列表,如div內的項目列表。我想忽略頭信息/腳本/ CSS等只需要獲取數據,並在我自己的主題樣式。
請告訴我最好的方法/函數來獲取內容和風格的輸出。如果你能饒了某個時候,並提前
我會使用HTML解析器。我用簡單的HTML DOM PARSER:http://simplehtmldom.sourceforge.net/它很棒。也有一個很好的文檔。它給在其主頁這個例子:
// Create DOM from URL or file
$html = file_get_html('http://www.google.com/');
// Find all images
foreach($html->find('img') as $element)
echo $element->src . '<br>';
// Find all links
foreach($html->find('a') as $element)
echo $element->href . '<br>';
一個方式你可以做到這一點是使用file_get_contents
編寫一個基本的代碼將是非常有幫助...
感謝。
例子:
$fileHTML = file_get_contents('http://www.google.ca');
$title = substr($fileHTML,strpos($fileHTML,'<title>') + 7,strpos($fileHTML,'</title>') - (strpos($fileHTML,'<title>') + 7));
的+ 7,它會轉到<標題>
echo $title;
這應該顯示了谷歌網站的標題末尾。
這樣做的方式是通過抓取ID的方式,因爲在適當的網站中,所有的ID都是唯一的。
「一切都有一個id是唯一的。」情況並非總是如此。使用DOM解析器 –
也許你會在這裏找到答案:http://stackoverflow.com/questions/5045598/getting-elements-of-a-div-from-another-page -php :) – Ddorda