2017-04-11 38 views
0

我想訪問以下大學網站的所有學生的學生詳細信息https://java.access.uni.edu/ed/faces/searchStudent.jsp 我不知道學生的名字,我想訪問每個學生的詳細信息。 該目錄是開放的,沒有任何非法的。 我使用以下github代碼作爲參考。 https://github.com/JoshuaRLi/direktory/blob/master/direktory.py 請幫忙!使用python訪問web目錄

+0

你的問題甚至不是問題,如果你對你想做什麼更具體,也許有人可以幫助你 –

回答

0

你可以做到這一點使用bs4 beautifulsoup這將幫助你放棄從給定的目錄中的內容...它基本上就是Web刮..

這就是你的GitHub的鏈接表示...

另一種方法是,selenium webdriver .. 從這個方法中,你可以簡單地傳遞url,然後給出相應的字段名和它的值。

可以觸發硒本身API網址...

其他你可以直接使用 蟒蛇請求方法發送POST請求並得到響應

...

這裏是如:

>>> import requests 
>>> r = requests.post("https://java.access.uni.edu/ed/faces/searchStudent.jsp;jsessionid=e8093da105003620293edb31ec442edfdfa514485389b950c4f20b46515aa640.e34Sbx0MaNuObi0LahiMaxmRb30Re0", data={'txtLastName':'mohamemd','txtFirstName':'mohideen','txtEmail':'[email protected]','soMajor':0,'soCollege':0,'soClass':0}) 
>>> r.status_code 
200 
>>> r.text[:300] 
u'<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"\r\n"http://www.w3.org/TR/html4/loose.dtd">\r\n\r\n\r\n\r\n\r\n\r\n\r\n <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/loose.dtd"><html dir="ltr" lang="en-US">\r\n <head id="head1"><title>UNI Directory - Student Search</t' 
>>> a = r.text[:300] 
>>> len(a) 
300 
>>> 

在這裏,我限制輸出爲300 ..如果你想完全可以簡單地打印,

r.text 
+0

我不知道學生的名字,我需要訪問所有學生的名字和他們的詳細信息目錄 。任何幫助? –

+0

爲此,我們需要了解API如何看起來 –

+0

網站不適用於本 –