2008-12-09 32 views
0

我發現使用腳本從wikipedia下載文本的唯一可靠方法是使用cURL。到目前爲止,我唯一要做的就是致電os.system()。即使輸出在python shell中正確顯示,我似乎也無法返回除退出碼(0)以外的任何其他功能。或者有人可以證明如何正確使用urllib如何從標準輸入使用os.system()獲取數據

回答

7

Dive into Python:

import urllib 
sock = urllib.urlopen("http://en.wikipedia.org/wiki/Python_(programming_language)") 
htmlsource = sock.read() 
sock.close() 
print htmlsource 

這將打印出Python的維基百科文章的源代碼。我建議你看看Dive into Python的更多細節。

例使用的urllib2從Python Library Reference:

import urllib2 
f = urllib2.urlopen('http://www.python.org/') 
print f.read(100) 

編輯:你也可能想看看wget.
EDIT2:新增的urllib2例如基於美國洛特的建議

+0

謝謝,內置在幫助瀏覽器幾乎是不可理解的。 – GameFreak 2008-12-09 01:29:18

2

回答這個問題, Python有一個子進程模塊,它允許你與生成的進程進行交互。 http://docs.python.org/library/subprocess.html#subprocess.Popen

它允許您讀取被調用進程的標準輸出,甚至可以將項目發送到標準輸入。

但正如你所說urllib是一個更好的選擇。如果你search stackoverflow我相信你會發現至少有10個其他相關的問題...

相關問題