0
我試圖解析一個新聞網站的RSS源,並提取出版日期,標題,描述和鏈接到實際文章。因此,與這些代碼行遠:循環播放bs4.element.tag
with open('text.txt', 'r', encoding='utf-8') as f:
soup = bs4.BeautifulSoup(f, 'lxml')
all_item_tags = soup.find_all('item')
first = all_item_tags[0]
second = all_item_tags[1]
print(first.contents[9].contents[0], first.contents[1].contents[0], first.contents[4], first.contents[5].contents[0])
print(second.contents[9].contents[0], second.contents[1].contents[0], second.contents[4], second.contents[5].contents[0])
我得到的信息,但我無法搞清楚如何循環它抓住的all_item_tags
各項指標,然後將這些指數的.contents[].contents[]
而無需編寫first
second
third
等
編輯:的text.txt
內容 - http://www.dailymail.co.uk/home/index.rss
你能提供text.txt嗎? – pregmatch
如何使用all_item_tags中的item_tag? –
它工作ty! item_tag in all_item_tags –