2017-04-16 73 views
0

我試圖解析一個新聞網站的RSS源,並提取出版日期,標題,描述和鏈接到實際文章。因此,與這些代碼行遠:循環播放bs4.element.tag

with open('text.txt', 'r', encoding='utf-8') as f: 
    soup = bs4.BeautifulSoup(f, 'lxml') 
    all_item_tags = soup.find_all('item') 
    first = all_item_tags[0] 
    second = all_item_tags[1] 
    print(first.contents[9].contents[0], first.contents[1].contents[0], first.contents[4], first.contents[5].contents[0]) 
    print(second.contents[9].contents[0], second.contents[1].contents[0], second.contents[4], second.contents[5].contents[0]) 

我得到的信息,但我無法搞清楚如何循環它抓住的all_item_tags各項指標,然後將這些指數的.contents[].contents[]而無需編寫firstsecondthird

編輯:的text.txt內容 - http://www.dailymail.co.uk/home/index.rss

+0

你能提供text.txt嗎? – pregmatch

+0

如何使用all_item_tags中的item_tag? –

+0

它工作ty! item_tag in all_item_tags –

回答

0

從評論部分:

for item_tag in all_item_tags怎麼樣? – t.m.adam