0
嗨,我的第一篇文章,我寫這篇文章,因爲我經歷了google知道關於htmlcleaner的每一個例子...我不能讓我的項目運行;(我試着做一個Android應用程序獲取和顯示來自Flash富媒體網頁的數據,其想法是隻獲取最重要的數據,以便用戶不浪費時間,處理金錢,試圖在他們的智能手機上撼動這些網頁......這是一個國家特定的網頁......因此國家pecific應用。在我需要解析的頁面有這部分Android的HTML解析應用程序htmlcleaner
<li class="genre-3 genre-7 genre-9 mi-37 ">
<a href="http://some_link.co"; class="image"><img src="picture.jpg" alt="altTitle"></a>
<div class="superClass">
<a> aaa </a>
<a href="http://some_link_2.co"> bbb </a>
<a href="http://some_link_3.co"> ccc </a>
<a href="http://some_link_4.co"> ddd </a>
<a href="http://some_link_5.co"> eee </a>
</div>
<h2><a href="http://some_other_link" class="title">title_of_super_product</a></h2>
<ul class="icons tooltip-enabled">
<li class="before"></li>
<li><img src="15_2.png" alt="15_2"></li>
</ul>
<div> </div>
<span class="material">some_material</span>
<span class="price">0.1USD</span>
<p class="text"> Some description </p>
<a class="button-more" href="http://link_to_more_info"></a>
</li>
上面是列表項,還有其他網頁上similiar。我有java類願與李lements數據來填充它一clsss對象爲一個li元素。我需要從superClass中提取描述,價格,材料,圖像鏈接,以及aaa,bbb,ccc,ddd等內容......最大的問題是如何做到這一點?我想,如果我從製作陣列將由li元素的開始我將能夠進一步搜索他們每個人的子元素,我需要......但它合乎理工作;(
TagNode[] liElements = rootNode.getElementsByName("li", true);
for (int i=0; liElements != null && i < liElements.length; i++) {
if(liElements.getAttributeByName("class").contains("genre"))
Log.d("li",liElements.getAttributeByName("class")); }
只給人的第一(;(((
轉換爲jsoup其waaaaaaaaaaaaaay更好^ _ ^ – mentis