-5
如何從imdb borntoday頁面提取信息?beautifulsoup imdb borntoday頁面
我看了這個問題,並沒有在那裏回答。
Webscraping an IMDb page using BeautifulSoup
我曾嘗試下面的代碼
import urllib2
from bs4 import BeautifulSoup
test_url='https://m.imdb.com/feature/bornondate'
url=urllib2.urlopen(test_url)
html_text=url.read()
soup=BeautifulSoup(html_text)
poster=soup.find('a','poster')
print poster
print type(poster)
print type(soup)
print html_text
url.close()
我試圖保持邏輯循環之前找到ATLEAST一個元素。
html頁面內容如下。輸出海報和類型(海報)給我沒有。請幫助我在代碼中缺少的地方。
<section class="posters list">
<h1>January 18</h1>
<a href="/name/nm0000126/" class="poster "><img src="https://images-na.ssl-images-amazon.com/images/M/[email protected]_V1._CR0,0,419,618_SX40_SY59.jpg" style="background:url('http://i.media-imdb.com/images/mobile/people-40x59-fade.png')" width="40" height="59"><div class="label"><span class="title">Kevin Costner</span><div class="detail">Actor, "Dances with Wolves"</div></div></a>
謝謝, Phani。
請發表您已經嘗試的代碼。 –
檢查答案。那是你在找什麼? – MYGz
是的,我只想要前十名演員。我正面臨一些導入dryscrape的問題,但看起來像你發佈的代碼應該工作。另外我明白,動態內容html提取不可能與美麗的。感謝您的迴應。 – ppeddi