2017-04-09 45 views
0

從Tumblr博客下載所有圖像/ webms/mp4s的最佳方式是什麼?從Tumblr博客下載所有超鏈接的URL?

我期待一些的tumblr博客下載所有文章/圖像/視頻,並且他們中的超鏈接後的身體,這Tumblripper/BulkImageDownloader /其他的tumblr圖像下載者不抓gfycat/WEBM版本。我認爲這是一個問題,因爲它們在體內超鏈接,而不是實際上「在」Tumblr上。

任何人都知道一個很好的解決方案,從Tumblr博客下載所有內容?我也嘗試過wget和httrack,但他們似乎沒有工作。

我寧願使用帶GUI的程序來做我需要做的事情,而不是基於命令的程序,因爲我幾乎不知道如何工作。我花了很長時間才弄清楚wget,而且我沒有時間去學習另一個下載Tumblr博客。

回答

0

我明白,你是反對的命令行工具,但我會personnally使用curl編寫網頁的源文件:

curl www.tumblr.com/something > outfile.html 

然後你就可以分析在您習慣使用什麼語言文件。 這個答案對如何做一些很好的建議,使用grep: https://unix.stackexchange.com/questions/181254/how-to-use-grep-and-cut-in-script-to-obtain-website-urls-from-an-html-file

像這樣的:

$ curl -sL https://www.google.com | grep -Po '(?<=href=")[^"]*(?=")' 
/search? 

它給你:

https://www.google.co.in/imghp?hl=en&tab=wi 
https://maps.google.co.in/maps?hl=en&tab=wl 
https://play.google.com/?hl=en&tab=w8 
https://www.youtube.com/?gl=IN&tab=w1 
https://news.google.co.in/nwshp?hl=en&tab=wn 
...