我一直沒能找到一個簡單的方法來做到這一點,我一直在關注this ,我寫了下面,簡單的Web使用Python
##just comments before this
import lxml,requests
23 page = requests.get('https://finalexams.rutgers.edu.html')
24
25 tree = html.fromstring(page.text)
26
27 tableRow = tree.xpath('//tr/text() ')
28
29 print 'Rows' , tableRow
該腳本需要通過解析表像這樣的行並將其中的內容取出,但可能會有無數的錶行。我不知道如何訪問嵌套標籤,並且他們沒有唯一的名稱或ID以供我查找。
我該如何編寫一個for循環來獲取這些表格行中的每一行,並讓我抓取它們的各個位?
<tr>
<td> 04264</td>
<td>01:198:205</td>
<td>01</td>
<td>INTR DISCRET STRCT I</td>
<td>C</td>
<td>Dec 17, 2014: 8:00 AM - 11:00 AM </td>
</tr>
<tr>
<td> 09907</td>
<td>01:198:214</td>
<td>01</td>
<td>SYSTEMS PROGRAMMING</td>
<td>C</td>
<td>Dec 18, 2014: 8:00 PM - 11:00 PM </td>
</tr>
'tree = html.fromstring(page.text)'不會使用'import lxml';你在某處做過「從lxml導入html」嗎? – abarnert 2014-12-03 02:31:28