2013-06-01 88 views
1

我編寫了這個訪問網站的網絡爬蟲程序,然後將輸出寫入HTML文件。無法使用瀏覽器打開文件

雖然我有以下問題。我無法使用網絡瀏覽器打開輸出文件。不過,我可以使用webbrowser模塊打開URL。是否可以使用此方法打開文件?如果是的話,我該怎麼做呢?

import urllib 
import webbrowser 

f = open('/Users/kyle/Desktop/html_test.html', 'w') 
u=urllib.urlopen('http://www.ebay.com') 
f.write(u.read()) 
f.close() 

webbrowser.open_new('/Users/kyle/Desktop/html_test.html') 
+0

代碼工作正常,我 - 打開瀏覽器的HTML通過'urllib'下載的文件。你有沒有看到任何錯誤?發生什麼事? – alecxe

+1

你使用的是Windows還是Linux? 我建議在前面添加一個文件://(製作3個斜線)(webbrowser.open_new('file:///Users/kyle/Desktop/html_test.html') – Foon

+0

它是由路徑判斷的窗口:) – PSS

回答

1

如果您正在使用python3,你應該使用urllib.request裏:

from urllib import request 
filename = '/Users/kyle/Desktop/html_test.html' 

u = request.urlopen('http://www.ebay.com') 
with open(filename, 'wb') as f: #notice the 'b' here 
    f.write(u.read()) 

import webbrowser 
webbrowser.open_new(filename) 
+0

(當我用反斜槓運行代碼時(-2741) 118:119:語法錯誤:預期的「」「但是找到未知的標記。 (-2741) 117:118:語法錯誤:預期的「」「但發現未知的令牌。(-2741) –

+0

@ kylek,我很抱歉 - 我想這不是分隔符,如果你正在運行mac。 – Elazar