我想使用Jsoup
來抓取僅在我登錄時可用的頁面。我想這意味着我需要登錄一個頁面並將Cookie發送到另一頁面。
我看了一些以前的職位here和寫下面的代碼:使用Jsoup登錄並抓取數據
public static void main(String[] args) throws IOException {
Connection.Response res = Jsoup.connect("login.yahoo.com")
.data("login", "myusername", "passwd", "mypassword")
.method(Method.POST)
.execute();
Document doc=res.parse();
String sessionId = res.cookie("SESSIONID");
Document doc2 = Jsoup.connect("http://health.groups.yahoo.com/group/asthma/messages")
.cookie("SESSIONID", sessionId)
.get();
Elements Eles=doc2.getElementsByClass("message");
String content=Eles.first().text();
System.out.println(content);
我的問題是我怎麼能在這裏認識我的cookie的名稱(即「SESSIONID」)發送我的登錄信息?我用.cookies()
方法來獲取所有從登錄頁面餅乾:
乙
DK
YM
牛逼
PH
Ÿ
˚F
我想他們一個一個但沒有工作。我可以從其中的一些獲得sessionId,但是我無法從第二頁成功獲取節點,這意味着我沒有成功登錄。任何人都可以給我一些建議嗎?非常感謝!
雅虎有很多cookie,通過https執行登錄和其他安全隱患。 – vikiiii 2012-04-15 04:05:18