好吧,我正在製作一個程序來測試某個網站中的某些頁面是脫機還是聯機。將文本存儲在Python中的txt文件中
import urllib2
u = 'http://www.google.com/'
pages = open('pages.txt', 'r').readlines()
for page in pages:
url = u + page
try:
req = urllib2.urlopen(url)
except urllib2.HTTPError as e:
if e.code == 404:
print url + " does not exists"
else:
print url + " exists"
和「Pages.txt」包含了這樣的事情:
search
page
plus
signin
account
security
lol
about
contactus
someotherpage.html
現在程序工作正常,但我想它存儲在一個TXT文件中的可用頁面。有人可以幫助我嗎?如果不僅僅列出存在的頁面而忘記脫機頁面也會很棒。謝謝:)
將不只是存儲的一切嗎?我不希望脫機網站出現 –
我認爲只有您的打印將在文件實際上... – Richard
但我的打印也包含「不存在」頁面 –