2012-03-16 214 views
2

我需要在c#中製作一個Windows桌面應用程序,用於從網站下載所有PDF。我有鏈接到網站,但我面臨的問題是,PDF不在網站上的特定文件夾中,但分散在各地。從網站下載所有PDF文件

我需要的是幫助找到所有這些鏈接,以便我可以下載它們或任何其他可以幫助我解決問題的建議。

感謝在先進的所有幫助。

+4

所以你想寫一個蜘蛛? – SLaks 2012-03-16 21:13:43

+0

我相信有很多免費的解決方案可以做到。 – Andrew 2012-03-16 21:16:15

+0

是的,我想我需要一隻蜘蛛,但我不知道要搜索什麼。現在我已經搜索了蜘蛛,我真的需要這樣的東西。 – EaglesNiko 2012-03-16 21:24:29

回答

1
  1. 勉強通過的所有網頁
  2. 找到所有的「* .PDF」網址
  3. 重建他們只需下載:)

請再具體些,你試圖讓所有的來自html頁面或整個域名的PDF文件?

+0

我需要從整個域中找到所有的pdf。 – EaglesNiko 2012-03-16 21:22:24

+0

您可以使用谷歌!谷歌爲「* .pdf inurl:website」,它應該爲您提供所有索引可訪問PDF文件的列表。這有幫助嗎? – 2012-03-16 21:24:04

+0

我想到了,但我想找到一個更可編程的解決方案 – EaglesNiko 2012-03-16 21:26:58