我想開發一個asp.net頁面,通過它我可以指定任何頁面的URL,其中包含許多文件目錄的鏈接。我想要全部下載它們。類似於FireFox的DownThemAll插件。從任何頁面下載所有鏈接
即
「MyPage.htm」文件中包含許多鏈接到位於同一臺服務器上的文件/目錄。
現在我希望編寫可以下載所有這些文件中的函數,如果我提供
「www.mycustomdomain.com \ Mypage.htm」作爲輸入。
我希望問題很清楚。
我想開發一個asp.net頁面,通過它我可以指定任何頁面的URL,其中包含許多文件目錄的鏈接。我想要全部下載它們。類似於FireFox的DownThemAll插件。從任何頁面下載所有鏈接
即
「MyPage.htm」文件中包含許多鏈接到位於同一臺服務器上的文件/目錄。
現在我希望編寫可以下載所有這些文件中的函數,如果我提供
「www.mycustomdomain.com \ Mypage.htm」作爲輸入。
我希望問題很清楚。
抓取網頁爲HTML。 Google(c#從網絡獲取文件)。第一個鏈接會給你這個想法。
然後找到正則表達式的鏈接。 在www.x.com鏈接的一些例子正則表達式應該是爲 (http://www.x.com/。*?) (但更好,如果你還包括一個標籤在你的正則表達式)
希望我明白你的問題。你有一個帶有鏈接列表的HTM文件,這些鏈接是指向遠程服務器上特定文件的鏈接,並且你想要下載所有的文件。
有沒有失敗的辦法來做到這一點。
檢查這個問題。 How do you parse an HTML in vb.net儘管這是針對VB.net的,但它與您要求的內容有關。您可以獲取一系列鏈接,然後開始下載文件。
您可以使用Computer.Network.DownloadFile方法下載遠程文件並將其保存在您的位置。
氏是不是一個失敗prrof方法,因爲如果下載需要身份驗證,然後它會下載HTML頁面[大多裏脊頁]
不,問題不明確。你的問題到底是什麼? – naivists
我假設你只考慮HTTP/HTML?你能解析HTML嗎?看看HTML敏捷包。 –
您沒有提出任何問題。你剛剛發佈了一個「願望清單」。 – Oded