我是網絡爬行新手,遇到問題。BeautifulSoup:從網站獲取信息(父母/子女問題?)
我想2點的信息,從這個頁面:我想 https://boardgamegeek.com/boardgame/197070/massive-darkness
的信息是:
- minimum number of players
- maximum number of players
我已經做了rignt集團公司的 「1-6球員」 去「檢查」,我得到:
<div class="gameplay-item-primary"> <!----><span ng-if="::geekitemctrl.geekitem.data.item.minplayers > 0 || geekitemctrl.geekitem.data.item.maxplayers > 0" min="::geekitemctrl.geekitem.data.item.minplayers" max="::geekitemctrl.geekitem.data.item.maxplayers"> <!----><span ng-if="min > 0">1</span><!----><!----><span ng-if="max>0 && min != max"><!----><span ng-if="min>0">–</span><!---->6</span><!----> </span><!----> Players </div>
我想:
url=requests.get('https://boardgamegeek.com/boardgame/197070/massive-darkness')
website=url.content
soup = BeautifulSoup(website, "html.parser")
tmp=soup.find("div",{"class":"gameplay-item-primary"})
但TMP的類型是無(而不是類的bs4.element.Tag') - >在它裏面沒有信息,我不知道爲什麼....
Question1: How do I get the 2 informations I want?
Question2: What does "!----" means?
Question3: When I only do
soup.find("div")
I get a class 'bs4.element.Tag' object but I still don't know where to get my information with it...
謝謝您的回答。 我確實使用了BeautifulSoup4,但我沒有使用urllib3 ..... 我嘗試了你的代碼,即使我沒有去掉它(我是一個新手)。但我沒有「Scrapper」,「pip install Scrapper」bug和「conda install Scrapper」沒有找到它.....所以我卡住了:-) 我會試着重新問我的問題以一種簡單的方式。不管怎樣,謝謝你! :-) – Anneso
@Anneso它是正確的嗎? – Grynets
嗨格里奈斯,我不明白你的問題....什麼應該是正確的?此外,我工作你的代碼。 Scrapper不存在,但刮板確實....因此,我安裝它並更正您的代碼。但是,我仍然得到一些錯誤:「TypeError:module .__ init __()最多2個參數(給出3)」。我工作python3也許這就是爲什麼.... – Anneso