2013-02-20 111 views
0

我學習的XPath &網絡使用Django動態刮除又名DSS(Django的+ scrapy)刮並嘗試從一個網站,下面的代碼檢索數據:刮無鏈接

<tr valign="top"> 
    <td align="center" valign="top"> 
     <p><img src="someimage.jpg"></p> 
    </td> 
    <td> 
    &nbsp; 
    </td> 
    <td> 
     <div align="left"> 
      <span class="style1"> 
       <strong>Title1</strong> 
      </span> 
      <span class="style2">Title2:</span>ContentA<br /> 
      <span class="style2">Title3:</span>ContentB<br /> 
      <span class="style2">Title4:</span>ContentC<br /> 
     </div> 
    </td> 
</tr> 

我的問題:

  • 如果在該代碼中沒有鏈接,an URL object of DSS的xpath是什麼?
  • 如果首先沒有課程<td>,那麼檢索圖像文件的xpath是什麼?
  • 如何檢索的每個數據來自ContentA,ContentB,&的數據如果跨度的類是same

回答

1

如果在該代碼中沒有鏈接,DSS的URL對象的xpath是什麼?

不能得到的問題,請你解釋一下嗎?

如果沒有第一個類,檢索圖像文件的xpath是什麼?

//tr[1]/td[1]//img/@src

如何檢索從ContentA,ContentB每個數據數據,& ContentC 如果跨度的類是一樣的嗎?

//text()[preceding-sibling::span[@class="style2"]]