2014-01-25 125 views
0

我想從此xml源導入http://www.lnv.fr/xml/ajaccio/calendrier.xml 我有一些麻煩,因爲我想提取的某些數據具有法語重音標記。將unicode對象添加到列表中時遇到問題

url = 'http://www.lnv.fr/xml/ajaccio/calendrier.xml' 
r = requests.get(url) 
soup = BeautifulSoup(r.content) 
matches = soup.findAll('match') 

當我這樣做

for match in matches: 
    print match.equipedomicile.string 

它打印出來,因爲他們應該有帶重音符號這樣的球隊賽特例如沒有問題。

但是,當我做到這一點

def GetGames(): 
homeTeamList = []  
for match in matches: 
    homeTeam = unicode(match.equipedomicile.text)   
    homeTeamList.append(homeTeam) 
return homeTeamList 

,並調用函數列表團隊重音符號不出來的權利。即賽特 現在變成將U \ xe8te」

回答

3

什麼你得到是repr版本的unicode字符串的,請在該列表的單個元素print,你會得到正確的輸出。

>>> a = [u'S\xe8te'] 
>>> a 
[u'S\xe8te'] 
>>> print a[0] 
Sète 
相關問題