2014-07-09 194 views
1

我使用Node.js(使用Request.js和Cheerio.js)創建了一個刮板,並且正在導航下載鏈接以下載PDF並將它們添加到我的文件夾中電腦。這些鏈接自動開始下載,它們不僅導航到呈現的PDF,所以我不知道如何將下載通過節點傳遞到文件夾。從Node.js自動下載鏈接下載PDF文件

回答

1

我不確定你提交的PDF是什麼意思,但是如果你知道文檔的url,只需發送一個ajax調用來獲取原始數據,並將其轉儲到輸出文件。

所以在這裏用Nodejs寫文件。 Writing files in Node.js

實施例從: http://www.sitepoint.com/making-http-requests-in-node-js/

var request = require("request"); 
var fs = require("fs"); 

request("http://www.sitepoint.com").pipe(fs.createWriteStream("jspro.htm")); 
+0

感謝您的響應。我的代碼中幾乎包含了精確的代碼片段,但當我導航到發送PDF文件的文件夾並嘗試打開它們時,它們將無法打開。他們看起來是空的(他們只有10個字節大)。我懷疑這與鏈接不符合實際PDF的事實有關,它只是啓動自動PDF下載。 – user3821746

+0

嘗試使用textedit/vi打開文件。我的預感是給你一個重定向鏈接。如果是這種情況,您只需要遵循鏈接跟蹤,直到您點擊實際的pdf。請記住,PDF必須存在於您的瀏覽器的網址下載,除非網站有一個奇怪的cms設置。 – droghio

+0

這非常有幫助,謝謝!這些文件只會顯示「您請求的頁面已被刪除」。這是鏈接迴應的主體。我不太確定該從哪裏出發,因爲據我所知,我無法遵循「鏈接線索」。當我在瀏覽器中加載給定的鏈接時,沒有任何東西被渲染(所以我不能做一個視圖源),下載剛剛開始。 – user3821746