與Reddit的r/pic子版本相似,我想彙總來自各種來源的媒體。有些網站使用OEmbed規範在網頁上展示媒體,但並非所有網站都這樣做。我正在瀏覽Reddit的來源,因爲實質上他們'刮'了用戶提交的鏈接,檢索圖像,視頻等。他們創建縮略圖,然後沿着他們網站上的鏈接顯示。現在,我想做類似的事情,我看着他們的代碼[1],似乎他們爲每個他們認識的領域都有自定義的刮板,然後他們有一個通用的Scraper類,它使用簡單的邏輯從任何域中獲取圖像(基本上他們檢索網頁,解析html,然後確定頁面上最大的圖像,然後用它們來生成縮略圖)。從Perl中的鏈接檢索媒體(圖片,視頻等)
由於它是開源的,我可能可以重用我的應用程序的代碼,但不幸的是我選擇了Perl,因爲這是一個業餘愛好項目,我正在嘗試學習Perl。有沒有一個Perl模塊具有類似的功能?如果沒有,是否有一個類似於Python Imaging Library的Perl模塊?在沒有實際下載整個圖像的情況下確定圖像大小將是方便的。
謝謝!
[1] https://github.com/reddit/reddit/blob/master/r2/r2/lib/scraper.py
感謝您的指針。我已經知道WWW :: Mechanize,但我主要是尋找檢索頁面和包裝上的媒體,而不是寫我自己的媒體。 –