2016-01-25 108 views
-5

我是新來的PHP數據抓取,我查看了其他線程,我找不到我需要的東西。 我想製作一個腳本,在信息發生變化的情況下不斷檢查網站,同時獲取信息。 例如: google.com 我想抓取「Google搜索」,但同時它會每隔一段時間檢查它是否已更改。 乾杯!PHP - 數據抓取

$html = file_get_contents($url); 

libxml_use_internal_errors(true); 
$doc = new DOMDocument; 
$doc->loadHTML($html); 
$xpath = new DOMXpath($doc); 


$node = $xpath->query('//div[@name="jsb"]')->item(0); 

echo $node->textContent; 
+0

您已添加代碼 - 很棒。但代碼的問題是什麼?你是說它不起作用嗎?如果真是這樣,那麼是以哪種方式? –

+0

你的問題和/或問題是什麼? –

+0

@Dagon我收到以下錯誤:注意:未定義的變量:第2行中的C:\ xampp \ htdocs \ test.php中的url 警告:file_get_contents():文件名在C:\ xampp \ htdocs \ test中不能爲空.php on line 2 警告:DOMDocument :: loadHTML():在第6行的C:\ xampp \ htdocs \ test.php中輸入的空字符串 注意:試圖獲取C中非對象的屬性: \ xampp \ htdocs \ test.php 12行 –

回答

1

PHP Simple HTML DOM Parser將是一個很好的起點和還閱讀了關於Cronjobs

但是告訴我們你得到了什麼,到目前爲止,所以我們可以幫助你,我們是不會寫代碼您。

編輯:

問題是這一行:

$html = file_get_contents($url); 

其中定義$網址是什麼?它看起來像是空的,你可以試着用網站鏈接替換它,看起來像這樣。

$html = file_get_contents("http://domain.tld/page"); 
+0

已編輯主帖子。 –

+0

感謝您解決這個問題,我瞎了....但現在我得到這個錯誤:注意:試圖獲得非線對象的屬性在C:\ xampp \ htdocs \ test.php 12行 –

+0

這將是你的xpath這是不正確的,我會猜測。 – keja