2011-07-11 167 views
2

我想用一個簡單的PHP腳本來刮一個網站(相信它是在JavaScript中)。我是初學者,所以任何幫助將不勝感激。該網頁的網址是:使用php刮掉網站(JavaScript網站)使用PHP

http://www.indiainfoline.com/Markets/Company/Fundamentals/Balance-Sheet/Yes-Bank-Ltd/532648

所以在這裏比如我想在get_file_contents通公司(是的,銀行,Ltd)的名稱和代碼(532648)。不知道如何做到這一點,有人請幫助。

感謝, 尼迪

+2

廢料,如「回收」?我想可以試試['unlink'](http://www.php.net/manual/en/function.unlink.php)。 –

+0

你是什麼意思,通過它,因爲我可以看到他們已經在url –

+1

@Kerrek SB,他的意思是'刮'。 – Nightfirecat

回答

1

你爲什麼不只是沒有追加公司與代碼的URL字符串。這是一個想法,你填寫一個公司和代碼(需要是相同的大小),然後你循環他們來刮你想要的數據。

for($i=0;$i<count($listOfCie);$i++) 
{ 
    $cie = $listOfCie[$i]; 
    $code = $listOfCode[$i]; 
    $urlToScrape = "http://www.indiainfoline.com/Markets/Company/Fundamentals/Balance-Sheet/" . $cie . "/" . $code 
    //... = get_file_contents($urlToScrape.... 
} 
+0

好吧,似乎是一個好主意。但是,當我嘗試使用你在這裏給出的hte語法時,它給出了一個問題。你能否請驗證你是否需要第一個變量中的兩個引號和第二個後面沒有引號。 – user839403

+0

你是開發人員嗎?報價驗證應該是你的工作來檢查。這只是一個僞代碼,向您展示如何解決您的問題。 –

+0

不,我不是一個開發人員,因此問題..對不起,造成你的麻煩 – user839403