0
我解析一些表從一個網站,特別我想提取由類名以下的細胞元素:Jsoup:選擇具有單個類
<td class=" text_bold">example</td>
我用的是標準Jsoup選擇提取與類代碼,如下所示:
Elements cells = doc.select("td.text_bold");
的問題是,有其也選擇,因爲它們具有兩個text_bold
類和另一個類的其他細胞,例如:
<td class="text_bold text_align_left" valign="top" width="150">example</td>
是否有一種簡單的方法來過濾僅具有select()
方法中指定的單個類的元素?
嘗試'doc.select( 「TD [類= 'text_bold']」)'。 – Vulcan
@Vulcan感謝您的建議。似乎它應該與'[attribute = value]'一起工作,但它返回0個元素。 – ashatte
'text_bold'之前或之後是否有空格,但仍在類聲明中?如果是這樣的話,你可能希望對startsWith使用'^ =',對於endsWith使用'$ =',或者如果空格在任一側和/或不一致,則使用正則表達式選擇符'〜='。 – Vulcan