2012-09-22 84 views
-3

可能重複:
HTML Scraping in Php腓複製網站表

遠提前爲web開發專家,很抱歉,如果我失去了一些基本的東西:

我需要使用PHP將表複製到mySql數據庫中;該表位於我沒有的網站中,但我有權複製和發佈。

手動當我在我的網頁瀏覽器中觀看這個網站時,我需要點擊主網站URL中的鏈接(我無法到達最終的目標頁面鏈接,因爲它始終更改,但主頁面鏈接是靜態和點擊鏈接也是靜態的)。

例這樣的內容我需要從複製(只是一個例子,這是不是真正的內容): http://www.flightstats.com/go/FlightStatus/flightStatusByAirport.do?airportCode=JFK&airportQueryType=0

+2

和標準問題 - 你有什麼嘗試? –

+0

只因爲你需要一些東西,這還不是一個問題。你的具體問題是什麼?哪一部分是你遇到的第一個問題,你想知道什麼?或者你想學習如何構建一個刮板? – hakre

+0

感謝您的評論。我試過看Selenium和一些Wordpress插件進行網頁抓取,然後widtheld自己並有目的地詢問一般問題 - 因爲現在無法完成如此簡單的任務,我相信這只是我無法找到一個現有的解決方案(不需要重新發明)。這裏是我要求你幫忙的地方,爲這樣的任務推薦適當的平臺。在此先感謝... – Yizhar

回答

-1

大多數人會問你有什麼企圖。既然你提到你沒有太多的開發經驗,這裏有一些關於如何去做的提示 - 不得不把它當作答案來閱讀。

你將需要做的是刮。

使用PHP,你會使用以下功能至少是

file_get_contents() - 該功能將在URL中讀取的數據

preg_match_all - 使用正則表達式將讓你得到你的數據正在找。雖然有些/很多人會說你應該瀏覽DOM。

與preg_match_all一起返回的數據可以存儲到MySQL表中。雖然因爲數據變化頻繁,你可能會更好的只是刮掉這部分並將整個表格存儲爲緩存(儘管我不得不說我不知道​​你在網站上做什麼 - 所以我很可能會錯誤)。

+0

-1 for preg_match_all,對不起。 – vascowhite

+0

@vascowhite哈 - 當然 - 我預料到了。 :) – Duniyadnd

+0

轉到[DOM!](http://php.net/dom)。 :) – vascowhite