2017-06-21 75 views
0

我現在正在使用網絡爬蟲,而且似乎無法從特定網站獲取div內部的類。以下是我的代碼。我用BeautifulSoup在Python3如何使用BeautifulSoup查找嵌套div中的類python

import requests 
from bs4 import BeautifulSoup as bs 

response = requests.get('https://e27.co/startup/flipkart').text 
soup = bs(response, 'html.parser') 
content_div = soup.findAll('h1',class_ = 'profile-startup') 
print(content_div) 

我想提取具有一流「的輪廓,啓動」的H1內的文本。上面的代碼什麼也沒有返回你們能幫我嗎?

回答

0

本網站使用Javascript填充數據。如果您查看response中的內容,您將會看到沒有h1。你必須看看他們是否有API可以用來檢索你需要的信息,或者考慮使用像Selenium這樣的瀏覽器自動化技術:http://selenium-python.readthedocs.io/installation.html#introduction

+0

感謝您的幫助!我會嘗試使用硒! –