我試圖檢索網站,並使用Python Mechanize將它們保存在本地磁盤上。問題是許多網站重定向到html/asp/php以外的鏈接。有沒有準確的方法來檢測URL的擴展名以及它將檢索的文件類型?Python機械化檢測下載的文件擴展名
例如: http://www.yahoo.com 應保存爲html文件。
http://www.microsoft.com/en-us/download/confirmation.aspx?id=3745 應該保存爲.exe文件,因爲它會重定向,然後下載一個exe文件。內容類型被聲明爲text/html,所以這不是我猜測的最可靠的方法。
如何準確檢測瀏覽器在保存文件時的文件擴展名?因爲它重定向
感謝堆