我該如何編寫一個python程序,它從文本文件中讀取短URL列表,並對其進行擴展,然後將它們轉儲到另一個文件中?Python:URL擴展器
我需要爲每個鏈接找到最近的重定向(返回「200 OK」),並且不知道從哪裏開始。
我該如何編寫一個python程序,它從文本文件中讀取短URL列表,並對其進行擴展,然後將它們轉儲到另一個文件中?Python:URL擴展器
我需要爲每個鏈接找到最近的重定向(返回「200 OK」),並且不知道從哪裏開始。
可以使用requests
模塊解析URL重定向:
import requests
url = '...'
response = requests.head(url)
if response.is_redirect:
print(response.headers['Location'])
我以前正在查看類似的示例,但它們似乎適用於逐個鏈接的基礎。我不得不擴展1000個URL,並想知道我是否可以通過從文本文件中讀取URL來製作循環?我知道我想做什麼,只是不知道該怎麼做,或者如果這是一個好主意。 –
@ Blips-n-Chitz我認爲你需要從一個Python教程開始,它將向你展示如何編寫循環。 –
非常感謝!我現在要找一個! –
一種方式做,這將是使用Mechanize庫這樣:
import mechanize
br = mechanize.Browser()
br.set_handle_robots(False)
fLong = open("longURL.txt", 'w')
with open("shortURL.txt",'r') as fShort:
for url in fShort:
br.open(url)
fLong.write(br.geturl() + '\n')
fLong.close()
開始做一個文本文件與URL,make和'openFile()'函數讀取URL並將它們擴展到您喜歡的地方並將它們寫入另一個文件。你必須展示你嘗試過的東西的一些努力和代碼。此網站用於幫助其他人使用他們的代碼,而不是編寫它;-) –
當然!我只是無法入門,因爲我對python知之甚少! –
好吧,嘗試編寫一個函數,打開並讀取文件,從那裏谷歌和stackoverflow是你最好的朋友。也許嘗試一些關於codeacademy的學習來讓你開始? –