2012-09-19 116 views
1

我有這樣的HTML代碼(長HTML代碼的一部分):HTML DOM與jsoup

<div class="yt-lockup-content"> 
<h3 class="yt-lockup-ellipsize"> 
    <a class="yt-uix-contextlink yt-uix-sessionlink yt-uix-tile-link result-item-translation-title"dir="ltr"title="Rihanna ft. Calvin Harris - We Found Love LYRICS"data-sessionlink="ved=CAoQvxs%3D&amp;ei=CPLZjMDLwbICFUag3wod7Dm-pw%3D%3D"href="***/watch?v=1KzEu5hWmRY***">Rihanna ft. Calvin Harris - We Found Love LYRICS</a></h3><p class="description " dir="ltr"> 
     <b>bla</b> ft. Calvin Harris - 
     <b>bla</b> 
     bla bla 
     <b>bla bla bla</b> 
     <b>...</b> 
     </p><div class="yt-lockup-meta">  
     <ul class="single-line-lego-list"> 
     <li> <a href="/results?search_type=videos&amp;search_query=rihanna+we+found+love&amp;high_definition=1" class="yt-badge-std">HD 
     </a> 
</h3> 

,我希望得到這樣的文字:?HREF = /手錶V = 1KzEu5hWmRY(粗體文本)。 我知道如何得到所有的線,但我怎樣才能抓住這段文字? 謝謝, 或。

回答

0

下面是一個例子:

String html = // your html here ... 

Document doc = Jsoup.parse(html); 

Element element = doc.select("h3[class=yt-lockup-ellipsize] > a").first(); 
String hrefLink = element.attr("href"); 

然而,如果要分析一個網站,你應該使用Jsoup.connect("http://link.com").get()代替Jsoup.parse(html)

+0

謝謝! 你幫了我很多! – ork