0
我想刮這個網站:https://resultadoselecciones2016.onpe.gob.pe/PRP2V2016/Actas-por-Ubigeo.html
我該如何刮這個特殊的jQuery網站與python?
他們正在使用jQuery,所以數據不在「正常」的HTML代碼。我看到這個Chrome開發者控制檯上:
所以我這樣做對Python的2.7:
import urllib
import urllib2
url = 'https://resultadoselecciones2016.onpe.gob.pe/PRP2V2016/Actas-por-Ubigeo.html'
data = "pid=844399127479680.2&_clase=mesas&_accion=displayMesas&ubigeo=140107&nroMesa=034915&tipoElec=10&page=1&pornumero=1"
req = urllib2.Request(url, data)
response = urllib2.urlopen(req)
print response.read()
但它不工作,它只是打印正常HTML,而不是你在上面看到的迴應。
我該如何獲得這些數據?
您需要在您的服務器上運行無頭瀏覽器 – charlietfl
您可以使用Selenium或RoboBrowser執行此類任務。 –