2017-06-08 48 views
-1

我有一個html文檔,我試圖抓取。我已經到了文檔的「表格」部分,但我似乎無法訪問我想要的「td」。下面是該文件的一個部分的圖像看起來像: portion of html document如何使用BeautifulSoup訪問第二個「td」

這是我的一些代碼:

prePostBody.find("table", {"class": "tborder"}).find("tr", {"valign": "top"}).find("td") 
print(prePostBody) 

當我運行我的代碼,我得到這個:

<td class="alt2" style="border: 1px solid #D1D1E1; border-top: 0px; border-bottom: 0px" width="175"> 
<div id="postmenu_2012213"> 

所以我的代碼正在工作,它找到"td"class="alt2",但我想能夠訪問表的class="alt1"部分。我會怎麼做?

+0

圖片都難以處理。請考慮將其替換爲文本。 – styvane

回答

2

你爲什麼不嘗試:

prePostBody.find("table", {"class": "tborder"}).find("tr", {"valign": "top"}).find("td", {"class": "alt1"}) 
print(prePostBody) 
+0

這工作。謝謝 –