2014-02-26 32 views
0

從那裏我想刮我的數據代碼:Scrapy XPath查詢(從同級但不同對準標記刮痧)

<td class="pageHeading" valign="top">ABC<br><span class="smallText">[RK103401]</span></td> 
      <td class="pageHeading" align="right" valign="top">SAMPLE2<br> 

我想知道的XPath,這將導致我提取SAMPLE2。

我注意到類名是相同的,但不知道如何去做這件事。

謝謝!

+0

// TD [@類= 'pageHeading'] /文() 但是,讓所有的值。只需要Sample2 – quasarseeker

+0

你想要「Sample2」基於什麼標準?文本值本身?一些數據之前?父'table'中'td'的位置? –

+0

我只是需要文字。 – quasarseeker

回答

0

在查找XPath以選擇特定的內容時,您希望找到一個與您想要捕獲的內容相對應的元素。在這裏,很難說因爲沒有太多的HTML,所以我們不知道哪些元素不會在整個文檔中重複。

像這樣的事情可能做的伎倆:

//td[class="pageHeading" and align="right"]/text()