2013-05-27 30 views
0

這是一個簡單的我相信。我正在解析一個網站,我正在嘗試獲取標籤之間的特定文本。該文本將== [撤銷,活動,默認]我正在使用Python。我已經能夠打印出所有內部文本結果,但是我無法在網絡上找到特定文本的良好解決方案。這裏是我的代碼Python:打印TD標籤的特定文本行

from BeautifulSoup import BeautifulSoup 
import urllib2 
import re 

url = urllib2.urlopen("Some URL") 
content = url.read() 
soup = BeautifulSoup(content) 
for tag in soup.findAll(re.compile("^a")): 

print(tag.text) 

回答

1

我還不確定我明白你在做什麼,但我會盡力幫忙。

soup.find_all('a', text=['revoked', 'active', 'default']) 

這將只選擇那些<a …>有給出的字符串作爲其文本的一個標籤。

+0

多數民衆贊成它是先生,非常感謝你 –

0

我已經在類似的場合使用了下面的代碼片段。看看這是否符合你的目標:

table = soup.find(id="Table3") 

for i in table.stripped_strings: 
    print(i) 
+0

我試過你的代碼,我得到這個錯誤「TypeError:'NoneType'對象不可迭代」 –