2017-02-23 76 views
1

首先,在此先感謝您的幫助,非常感謝!Goutte/Web Scraping - 如何截取和下載文件

我已經成功設法讓Goutte進行身份驗證,打一個URL,更改一個選擇字段並單擊一個提交按鈕。

該頁面然後重新加載,並在加載完成後,將文件下載到客戶端。

如何在Goutte內截取此文件?我儘可能多地閱讀了doco,但似乎無法找到答案。然後,我想基本打這個文件,遍歷它並保存在本地。

根據文件類型,我想遍歷它,或者保存到本地。

謝謝:-)

回答

0

要實現這一點並不容易。在我的情況下,我打開文件所在的URL(認證後),然後服務器提供文件(作爲Page的對象),之後可以獲取頁面的內容。

// $url contains the path to the file. 
$session->visit($url); 
$page = $session->getPage(); 
$saved = file_put_contents($targetFilePath, $page->getContent()); 

在我的情況下,我正在下載zip文件。在你的情況下,可能將其保存在臨時位置,檢測類型,然後將其移動到任何所需的目錄。 希望這有助於。