2017-05-13 33 views
2

我想抓class_="href"class_="_e4d"。基本上希望使用BeautifulSoup在課堂上刮課。刮課一類

from bs4 import BeautifulSoup 
import selenium.webdriver as webdriver 

url = ("https://www.google.com/search?...") 

def get_related_search(url): 
    driver = webdriver.Chrome("C:\\Users\\John\\bin\\chromedriver.exe") 
    driver.get(url) 
    soup = BeautifulSoup(driver.page_source) 
    relate_result = soup.find_all("p", class_="_e4b") 
    return relate_result[0] 

relate_url = get_related_search(url) 
print(relate_url) 

結果:MARKUP_TYPE = MARKUP_TYPE)) P類= 「_ E4B」} {A HREF =「/搜索......一} {/ P}

我現在要刮HREF? 。結果我不知道下一步會感謝您的幫助

注意:我換成<>與{},因爲它沒有顯示爲HTML腳本

回答

2

實際上,你可以找到這個內a元素與一個去CSS selector

links = soup.select("p._e4b a[href]") 
for link in links: 
    print(link['href']) 

p._e4b a[href]將定位具有具有_e4bp元件內部的href屬性的所有a元素。

+0

太棒了,這工作得很好,謝謝! – Mwspencer