2017-06-13 35 views
0

選擇項目我有結果下面的列表:與beatifulsoup

<div id="resultlist" class="result-list "> 
    <article itemscope="" itemtype="http://schema.org/Residence" class="search-result-entry "> 
    <article itemscope="" itemtype="http://schema.org/Residence" class="search-result-entry "> 
    <article class="search-result-entry" id="wh_adition_FakeAd1"> 
    <article itemscope="" itemtype="http://schema.org/Residence" class="search-result-entry "> 
... 

隨着beautifulsoup我儘量選擇與類「搜索結果條目」的所有條目,以及項目類型=「HTTP:// schema.org/Residence」。

response = requests.get(url) 

#cancel parsing if page doesnt exists 
if response.status_code is not 200: 
    return 

soup = bs4.BeautifulSoup(response.text, "lxml") 
#print(soup.select("resultlist") 

#select all listings from lise, execlude adds 
results = soup.select('.search-result-entry') 
print(results) 

然而,此刻我還選擇那些與id="wh_adition_FakeAd1",其中一些線路後給我的指標差。 我想這一點,沒有任何結果:

results = soup.select('.search-result-entry meta[itemtype=http://schema.org/Residence]') 

任何想法,我怎麼能管理只選擇項,我需要什麼?

非常感謝提前。

回答

1

你可以試試這個。找到所有具有所需物品類型的物品標籤。這將僅打印具有該屬性的那些。

for line in soup.findAll("article", {"itemtype" : "http://schema.org/Residence"}): 
    print line 

你可以做與擁有者和ID

for line in soup.findAll("article", {"id" : "wh_adition_FakeAd1"}): 
    print line 

希望這有助於相同。

+0

謝謝,解決了! – fahrradlaus

+0

沒問題。很高興它有幫助。 –

相關問題