我的代碼:蟒蛇 - beautifulsoup find_all()產生的無效日期
import requests
import re
from bs4 import BeautifulSoup
r = requests.get(
"https://www.traveloka.com/hotel/detail?spec=22-9-2016.24-9-2016.2.1.HOTEL.3000010016588.&nc=1474427752464")
data = r.content
soup = BeautifulSoup(data, "html.parser")
ratingdates = soup.find_all("div", {"class": "reviewDate"})
for i in range(0,10):
print(ratingdates[i].get_text())
這些代碼將打印 「無效的日期」。如何獲得日期?
附加說明:
看來解決方案是使用硒或spynner,但我不知道如何使用它。此外,我不能安裝spynner,它總是堅持安裝lxml
這些日期是通過ajax請求生成的,數據發佈到https://api.traveloka.com/v1/hotel/hotelReviewAggregate,可以複製但不平凡。 –
@PadraicCunningham你會介意檢查我的[新問題](http://stackoverflow.com/questions/39703021/python-requests-fetch-data-from-api-based-website) –