我想從足球直播比分網站動態上傳內容到我的數據庫。如何將其他網站的內容保存到我的數據庫中?
我也想每天都從網站上的單個頁面(當天的足球比賽)做這個。
如果你只能通過連接和檢索該網頁的數據來幫助我,我會管理其餘的。
網站:http://soccerstand.com/ 語言:PHP/Java的 - MySQL的
謝謝!
我想從足球直播比分網站動態上傳內容到我的數據庫。如何將其他網站的內容保存到我的數據庫中?
我也想每天都從網站上的單個頁面(當天的足球比賽)做這個。
如果你只能通過連接和檢索該網頁的數據來幫助我,我會管理其餘的。
網站:http://soccerstand.com/ 語言:PHP/Java的 - MySQL的
謝謝!
您可以使用php的file函數來獲取數據。您只需將它傳遞給一個URL,然後將該內容作爲文件中的一行行返回。您還可以使用file_get_contents將內容作爲一個大字符串來獲取。
約一旁刮其他網站的數據倫理問題:
用PHP,你可以在網站上做了一個「開放」的呼籲,只要你設置corectly。看到這個頁面的更多細節和示例:http://www.php.net/manual/en/wrappers.http.php
從那裏你有網頁的內容,這是一個分手的問題。關於我的頭,我會使用正則表達式或HTML解析器來分解HTML,然後遍歷子元素並將數據解析到數據庫調用中以保存數據。
在網絡上解析HTML有很多資源,它只是選擇最適合你的一個問題。
請記住,您需要監視網站的變化,因爲如果他們更改元素或他們的類/標識符,您可能還需要更改您的分析結構。
使用curl你會得到頁面的內容,然後使用正則表達式,你會得到你想要的。
使用DOM解析和/或simplexml可能比正則表達式更容易解析獲取的內容。 – 2010-06-02 02:07:51
無論是那些處理重定向,網絡延遲或錯誤。在獲取遠程內容時應該使用curl。 – 2010-06-02 02:05:34