6
A
回答
14
我建議你考慮simple_html_dom。它會使它變得非常簡單。
下面是如何拉標題和第一圖像的工作示例。
<?php
require 'simple_html_dom.php';
$html = file_get_html('http://www.google.com/');
$title = $html->find('title', 0);
$image = $html->find('img', 0);
echo $title->plaintext."<br>\n";
echo $image->src;
?>
這是另一個沒有外部庫的例子。我應該注意到,在HTML上使用正則表達式不是一個好主意。
<?php
$data = file_get_contents('http://www.google.com/');
preg_match('/<title>([^<]+)<\/title>/i', $data, $matches);
$title = $matches[1];
preg_match('/<img[^>]*src=[\'"]([^\'"]+)[\'"][^>]*>/i', $data, $matches);
$img = $matches[1];
echo $title."<br>\n";
echo $img;
?>
+0
謝謝你的回答。我想我會堅持簡單的HTML Dom解析器庫,然後,每個人都在推薦它 – federicot 2012-03-21 22:13:43
2
您可以使用SimpleHtmlDom這樣做的正確方法。然後查找標題和img標籤或您需要做的其他事情。
+1
我曾經使用過的最好的第三方庫之一。高度推薦它。 – cchana 2012-03-21 21:56:00
相關問題
- 1. PHP網頁抓取
- 2. 在PHP中抓取網頁的照片
- 3. PHP Laravel網頁抓取get_meta_tags
- 4. DOMDocument PHP網頁抓取
- 5. 在python中抓取網頁
- 6. 在Delphi中抓取網頁
- 7. 在iOS中抓取網頁
- 8. python3中的網頁抓取
- 9. 在R的網頁抓取
- 10. Beautifulsoup網頁抓取
- 11. BeautifulSoup網頁抓取
- 12. Spyder - 網頁抓取
- 13. PHP網絡抓取HTMLDOM分頁
- 14. php curl從網頁抓取圖片
- 15. PHP curl網頁抓取突然失敗
- 16. 網頁抓取/屏幕抓取
- 17. 網頁抓取/抓取的資源
- 18. 網頁抓取/抓取基於GWT的網頁
- 19. 在Python/R中的網頁抓取javascript
- 20. r在網頁中抓取(帶循環)
- 21. 在VBA和Excel中抓取網頁
- 22. 使用JSoup網頁抓取網頁
- 23. 從抓取的網頁中提取值
- 24. 使用vba抓取網頁
- 25. 蟒蛇網頁抓取
- 26. 從網頁抓取文本
- 27. 刮屏|網頁抓取
- 28. Python - 網頁抓取問題
- 29. 優化網頁抓取
- 30. 網頁抓取性能
是的。有。你用Google嗎?你有沒有嘗試過任何東西? – 2012-03-21 21:41:43
是的,我不會問這裏,如果我沒有 – federicot 2012-03-21 21:43:27
所以...你試過了什麼? – 2012-03-21 21:44:30