2016-03-08 32 views
0

我打算寫一個工具從soccerway.com中提取數據。事實上,我將創造一種歷史。將id添加到解析器html元素?

正如你所看到的數據被分組到足球賽季,所以會有數據庫2015/2016, 2016/2017等等。我所做的是獲取數據,在數據庫中輸入數據,然後運行一個cron作業來更新這些值。問題是我應該對他們進行升級或者其他什麼事情。我目前只記住解析器的操作,但我不知道如何爲每個解析器項目創建一個鍵。例如,從我提供給你的鏈接中取得聯賽排名,我怎麼能(一旦輸入數據),在未來,檢查與cronjob有更新和替換值? 我知道要查看是否有更新可以利用字段lastUpdate標題並將其保存在數據庫的某個位置,那麼cronjob會檢查每個聯盟的該字段。但是,最重要的一點是要識別要更新的值,因爲我沒有可以參考的id。

有些想法?

回答

0

解析數據時,可以存儲即將到來的匹配的日期時間&,並設置腳本運行,然後(不會同時更新)。如果你直接解析HTML代碼,它不應該花很長時間。

+0

呃這裏的問題是認識到每個項目不只是matc –

+0

哦,在這種情況下,我認爲最直接的解決方案是將整個頁面代碼存儲到一個文件中,並每次與在線版本進行比較以檢查更新 –