2012-04-18 59 views
1

我正在處理lxml以獲取html頁面。
我想獲取類名爲'class1'的html表。
我做了這樣的事情:在使用lxml的HTML解析中使用相同類名的多個表格

for span in doc.xpath('//table[@class="class1"]'): 
print span 

但是,
在此之後我發現,有4個表中的HTML網頁,其中有類名稱爲「class1的」。
例如:

table A 
table B 
table C 
table D 

這些所有4代表具有相同的類名。
我怎樣才能取得表B?

回答

3

你可以得到列表的第二個項目:

 
result = doc.xpath('//table[@class="class1"]') 
if len(result) > 1: 
    print result[1] 

或者,如果你的表中有ID,您可以通過XPath的得到它:

 
print doc.xpath('//table[@id="you id"]')[0] 
+0

aha ok。我會嘗試 – sam 2012-04-18 04:53:29

2

我想你可能想在這裏...

doc.xpath('//table[@class="class1"]')[1] 
+0

謝謝你的回答。這很有幫助。 – sam 2012-04-18 05:08:43