2017-02-23 99 views
-2

我該如何編寫一個python程序,它從文本文件中讀取短URL列表,並對其進行擴展,然後將它們轉儲到另一個文件中?Python:URL擴展器

我需要爲每個鏈接找到最近的重定向(返回「200 OK」),並且不知道從哪裏開始。

+0

開始做一個文本文件與URL,make和'openFile()'函數讀取URL並將它們擴展到您喜歡的地方並將它們寫入另一個文件。你必須展示你嘗試過的東西的一些努力和代碼。此網站用於幫助其他人使用他們的代碼,而不是編寫它;-) –

+0

當然!我只是無法入門,因爲我對python知之甚少! –

+0

好吧,嘗試編寫一個函數,打開並讀取文件,從那裏谷歌和stackoverflow是你最好的朋友。也許嘗試一些關於codeacademy的學習來讓你開始? –

回答

0

可以使用requests模塊解析URL重定向:

import requests 

url = '...' 
response = requests.head(url) 
if response.is_redirect: 
    print(response.headers['Location']) 
+0

我以前正在查看類似的示例,但它們似乎適用於逐個鏈接的基礎。我不得不擴展1000個URL,並想知道我是否可以通過從文本文件中讀取URL來製作循環?我知道我想做什麼,只是不知道該怎麼做,或者如果這是一個好主意。 –

+0

@ Blips-n-Chitz我認爲你需要從一個Python教程開始,它將向你展示如何編寫循環。 –

+0

非常感謝!我現在要找一個! –

0

一種方式做,這將是使用Mechanize庫這樣:

import mechanize 

br = mechanize.Browser() 
br.set_handle_robots(False) 

fLong = open("longURL.txt", 'w') 

with open("shortURL.txt",'r') as fShort: 
    for url in fShort: 
     br.open(url) 
     fLong.write(br.geturl() + '\n') 

fLong.close()