2014-03-02 120 views
-1

我遇到了for循環的問題。在腳本中,我使用文本列表構建URL,然後爲列表的每個元素運行for循環。擁有所有網址後,我想從網站中提取信息。這是我遇到問題的地方。for循環的麻煩

我檢查了程序,它構建了正確的URL,但我不知道如何僅使用第一個URL提取所有元素的信息。

請問,任何人都有一個想法,我哪裏出錯了?

import urllib2 
import re 
from bs4 import BeautifulSoup 
import time 

date = date = (time.strftime('%Y%m%d')) 


symbolslist = open('pistas.txt').read().split() 


for symbol in symbolslist: 
    url = "http://trackinfo.com/entries-race.jsp?raceid=" + symbol + "$" + date +"A01" 
    htmltext = BeautifulSoup(urllib2.urlopen(url).read()) 
    names=soup.findAll('a',{'href':re.compile("dog")}) 
    for name in names: 
     results = ' '.join(name.string.split()) 
     print results 

,這是文本列表:

GBM 
GBR 
GCA 
GDB 
GSP 
GDQ 
GEB 
+0

是縮進是正確的?或錯字?當然是 –

+0

,這是錯字! –

回答

1

喜的人,試試這個:

import urllib2 
import re 
from bs4 import BeautifulSoup 
import time 

date = (time.strftime('%Y%m%d')) 


symbolslist = open('pistas.txt').read().split() 


for symbol in symbolslist: 
    url = "http://trackinfo.com/entries-race.jsp?raceid=" + symbol + "$" + date +"A01" 
    htmltext = BeautifulSoup(urllib2.urlopen(url).read()) 
    names=htmltext.findAll('a',{'href':re.compile("dog")}) 
    for name in names: 
    results = ' '.join(name.string.split()) 
    print results