我正在使用Jsoup。 我做得到document= connect.get();
並獲得html頁面。從網站獲取超鏈接
現在我把它寫到一個文本(字符串)。
我有填充這些頁面的用戶。 我知道每個用戶名。這些頁面有用戶名。 我能夠做一個string.contains(「用戶名」)來檢查用戶是否存在。
現在我的問題是: 我有一個有名字的用戶在
表
有序列表中體
無序列表
但在所有這些情況下,他們格式爲:示例
<li><a href="http://university.xxx.students.com/grade9/john/117429">2012 academic record</a></li>
有些是表和所有..
在這個例子中,我知道學生的名字=約翰。 我怎樣才能得到所有的網址?
==
我認爲不是所有的URL是這樣的: 'http://university.xxx.students.com/grade9/' 是否正確? –
是的。有些是在表格中,有些學生有--http://university.xxx.students.com/grade9/john/117429「>約翰 li和所有.. –
我正在尋找greping的頁面。如果在鏈接(或)文本中存在學生姓名,則提取鏈接。 –