使用python訪問web目錄

我想訪問以下大學網站的所有學生的學生詳細信息https://java.access.uni.edu/ed/faces/searchStudent.jsp 我不知道學生的名字，我想訪問每個學生的詳細信息。該目錄是開放的，沒有任何非法的。我使用以下github代碼作爲參考。 https://github.com/JoshuaRLi/direktory/blob/master/direktory.py 請幫忙！使用python訪問web目錄

來源

2017-04-11 Ardour Technologies

你的問題甚至不是問題，如果你對你想做什麼更具體，也許有人可以幫助你 –

你可以做到這一點使用bs4 beautifulsoup這將幫助你放棄從給定的目錄中的內容...它基本上就是Web刮..

這就是你的GitHub的鏈接表示...

另一種方法是，selenium webdriver .. 從這個方法中，你可以簡單地傳遞url，然後給出相應的字段名和它的值。

可以觸發硒本身API網址...

其他你可以直接使用 蟒蛇請求方法發送POST請求並得到響應

...

這裏是如：

>>> import requests 
>>> r = requests.post("https://java.access.uni.edu/ed/faces/searchStudent.jsp;jsessionid=e8093da105003620293edb31ec442edfdfa514485389b950c4f20b46515aa640.e34Sbx0MaNuObi0LahiMaxmRb30Re0", data={'txtLastName':'mohamemd','txtFirstName':'mohideen','txtEmail':'[email protected]','soMajor':0,'soCollege':0,'soClass':0}) 
>>> r.status_code 
200 
>>> r.text[:300] 
u'<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"\r\n"http://www.w3.org/TR/html4/loose.dtd">\r\n\r\n\r\n\r\n\r\n\r\n\r\n <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/loose.dtd"><html dir="ltr" lang="en-US">\r\n <head id="head1"><title>UNI Directory - Student Search</t' 
>>> a = r.text[:300] 
>>> len(a) 
300 
>>>

在這裏，我限制輸出爲300 ..如果你想完全可以簡單地打印，

r.text

來源

2017-04-11 07:19:44

我不知道學生的名字，我需要訪問所有學生的名字和他們的詳細信息目錄。任何幫助？ –

爲此，我們需要了解API如何看起來 –

網站不適用於本 –

使用python訪問web目錄

回答

相關問題