我從html頁面提取數據,然後解析包含這樣標籤的標籤,現在我嘗試了像提取子字符串等不同的方法,只提取標題和href標籤。但它不工作......任何人都可以幫助我。這是我的輸出使用java從html標記中提取內容
我的代碼
doc = Jsoup.connect("myurl").get();
Elements link = doc.select("a[href]");
String stringLink = null;
for (int i = 0; i < link.size(); i++)
{
stringLink = link.toString();
System.out.println(stringLink);
}
輸出
<a class="link" title="Waf Ad" href="https://www.facebook.com/waf.ad.54"
data- jsid="anchor" target="_blank"><img class="_s0 _rw img" src="https:
//fbcdn-profile-a.akamaihd.net/hprofile-ak-ash1/t5/186729_100007938933785_
508764241_q.jpg" alt="Waf Ad" data-jsid="img" /></a>
<a class="link" title="Ana Ga" href="https://www.facebook.com/ata.ga.31392410"
data-jsid="anchor" target="_blank"><img class="_s0 _rw img" src="https://
fbcdn-profile-a.akamaihd.net/hprofile-ak-ash1/t5/186901_100002334679352_
162381693_q.jpg" alt="Ana Ga" data-jsid="img" /></a>
代碼片段提取選擇性內容使用jsoup也將有所幫助(它的標籤在jsoup下) – PopoFibo
@PopoFibo我試過了..但它不工作我怎麼才能得到只有標題內容和href內容 – chopu
即使如此,顯示你的努力(即你的代碼)表示讚賞,即使這種努力沒有成果 – fge