2014-01-26 52 views
0

因此,我正在做一個小項目,我想從另一個網站獲取一些數據。在做了一些閱讀後,我想我應該使用cURL庫(& get_file_contents()) - 但它並不那麼容易,顯然。
在我的情況下,我想要一些表中包含的一些數據@http://www.nasdaqomxnordic.com/news/companynews
但問題是,它的唯一返回部分網站給我 - 我錯過了所有的表數據,大部分的CSS(不是我關心的CSS)。cURLlib/File_get_contents只加載部分數據

到目前爲止,我已經嘗試過,simple_html_dom,cURL,file_get_contents($url)和其他一些解析器,並且它們都似乎只返回部分數據。我現在用了幾個小時,似乎沒有去任何地方。

我使用下面的代碼來檢索網站。

function curl($url) { 
    $ch = curl_init(); 
    curl_setopt($ch, CURLOPT_URL, $url); 
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 
    $data = curl_exec($ch); 
    curl_close($ch); 
    return $data; 
} 

,並返回我是這樣的 - http://imgur.com/F1F74VT
希望得到一些幫助,我很擔心我的頭打壞到的東西 - 沒有人喜歡清理血液:)

編輯
所以我做了一些更多的挖掘,這似乎是因爲網站上的大部分內容都是動態加載的。

那麼我現在有哪些選擇?我設法得到的HTTP GET請求,即獲取數據的保持 - 但我不知道我的下一步是:)

回答

0

如果你不這樣做編程,那麼我會建議你使用任何網站抓取工具或軟件下載管理器。

但是,如果是必須使用代碼,那麼這裏是我的建議。使用curlfile_get_contents獲取html內容,然後將相關鏈接(/xyz/mycss.css)替換爲javascriptcss的絕對(http://www.site.com/xyz/mycss.css)鏈接。但它仍然不是100%完美的解決方案。

這並不像你最初想的那麼簡單。這個時候你已經意識到了。

+0

是的,我很快意識到,很遺憾我找不到真正的解決方案 - 但我設法解決它無論如何。 我瀏覽了網站發送的所有HTTP請求,並設法找到了我需要的信息。當我有了這個,我只是用cURL來請求它,我的「問題」就解決了。 但是,謝謝你的回答無論:) – user3238663