2009-12-16 54 views

回答

2

這是一個有點簡化:

>>> import urllib 
>>> import re 
>>> page = urllib.urlopen("http://google.com").read() 

# => via regular expression 

>>> re.findall("Shopping", page) 
['Shopping'] 

# => via string.find, returns the position ... 
>>> page.find("Shopping") 
2716 

首先,讓頁面(例如,通過urllib.urlopen)。第二次使用regular expression查找您感興趣的文本部分。或者使用string.find

+1

沒有多大意義使用're.compile'如果你不保存編譯正則表達式的變量。 're.findall(「購物」,頁面)'更簡單。 –

0

可以使用的urllib2

import urllib2 

webp=urllib2.urlopen("the_page").read() 

webp.find("the_word") 

希望幫助:d

0

如何打開網頁?

我覺得最方便易的方法是:

from urllib2 import urlopen 

page = urlopen('http://www.example.com').read() 

如何搜索一個字?

我猜你要尋找在明年的頁面一定的規律性,所以在這裏我們去:

import re 
pattern = re.compile('^some regex$') 
match = pattern.search(page) 
+0

如何複製答案? – SilentGhost

+0

@SilentGhost你的意思是複製一個答案是什麼意思? – satoru

相關問題