我從使用Python的網站上刮取內容。首先,我在Python上使用了BeautifulSoup
和Mechanize
,但是我看到該網站有一個通過JavaScript創建內容的按鈕,因此我決定使用Selenium
。Selenium與BeautifulSoup for web scraping
鑑於我可以使用Selenium和driver.find_element_by_xpath
等方法找到元素並獲取它們的內容,那麼當我可以使用Selenium處理所有事情時,有什麼理由使用BeautifulSoup
?
而在這種特殊情況下,我需要使用Selenium來點擊JavaScript按鈕,因此使用Selenium解析還是更好?還是應該同時使用Selenium和Beautiful Soup?
我從來沒有用Selenium解析HTML,但BeautifulSoup非常強大。這就是說,既然你已經在使用Selenium來做什麼了,爲什麼不把它用於兩者,直到你知道爲什麼你需要別的東西? – crowder
@crowder是的,現在我正在用Selenium做所有的事情,但是之前我使用過BS,所以我想知道哪些是最好的。關於解析,我認爲它與Selenium有點相同,我們有driver.find_elements_by_class_name(「...」)和BS,我們有soup.findAll('...',{'class' : '....'})。 我看到BS有點慢,你怎麼看? – elie
@elie:這真的是你想要達到的目標。 Selenium被設計爲web ui自動化工具,如果你只是想解析html,這是一個矯枉過正的行爲。如果您需要與頁面進行某種交互,請使用Selenium。 –