2011-09-13 81 views
0

嗨,我的第一篇文章,我寫這篇文章,因爲我經歷了google知道關於htmlcleaner的每一個例子...我不能讓我的項目運行;(我試着做一個Android應用程序獲取和顯示來自Flash富媒體網頁的數據,其想法是隻獲取最重要的數據,以便用戶不浪費時間,處理金錢,試圖在他們的智能手機上撼動這些網頁......這是一個國家特定的網頁......因此國家pecific應用。在我需要解析的頁面有這部分Android的HTML解析應用程序htmlcleaner

<li class="genre-3 genre-7 genre-9 mi-37 "> 
    <a href="http://some_link.co"; class="image"><img src="picture.jpg" alt="altTitle"></a> 
    <div class="superClass"> 
     <a> aaa </a> 
     <a href="http://some_link_2.co"> bbb </a> 
     <a href="http://some_link_3.co"> ccc </a> 
     <a href="http://some_link_4.co"> ddd </a> 
     <a href="http://some_link_5.co"> eee </a> 
    </div> 
    <h2><a href="http://some_other_link" class="title">title_of_super_product</a></h2> 
    <ul class="icons tooltip-enabled"> 
     <li class="before"></li> 
     <li><img src="15_2.png" alt="15_2"></li> 
    </ul> 
    <div> </div> 
    <span class="material">some_material</span> 
    <span class="price">0.1USD</span> 
    <p class="text"> Some description </p> 
    <a class="button-more" href="http://link_to_more_info"></a> 
    </li> 

上面是列表項,還有其他網頁上similiar。我有java類願與李lements數據來填充它一clsss對象爲一個li元素。我需要從superClass中提取描述,價格,材料,圖像鏈接,以及aaa,bbb,ccc,ddd等內容......最大的問題是如何做到這一點?我想,如果我從製作陣列將由li元素的開始我將能夠進一步搜索他們每個人的子元素,我需要......但它合乎理工作;(

TagNode[] liElements = rootNode.getElementsByName("li", true); 
    for (int i=0; liElements != null && i < liElements.length; i++) { 
    if(liElements.getAttributeByName("class").contains("genre")) 
    Log.d("li",liElements.getAttributeByName("class")); } 

只給人的第一(;(((

+0

轉換爲jsoup其waaaaaaaaaaaaaay更好^ _ ^ – mentis

回答

0
String classType =liElements.getAttributeByName("class"); 
if(classType!=null && classType.equals("genre........"); 
liElements[i]