title = str(Soup.find('td', {'id': 'bxgy_x_img'}))
title_re = re.compile('alt="(.*)"')
title_pat = re.findall(title_re, title)
由於某種原因,這不只是抓標題,我如何讓它抓標題?python正則表達式提取之間的引號
這是正在運行的HTML如下:
<td id="bxgy_x_img">
<alt="Title" id="bxgy_img_a" height="75" border="0" />
</td>
你在做什麼? – kindall 2012-01-13 18:34:55
您使用的是BeautifulSoup嗎?如果這樣的屬性可用,就像它們是字典的鍵一樣,例如td ['alt'] – Peter 2012-01-13 18:36:05
對於HTML,['alt'](http://en.wikipedia.org/wiki/Alt_attribute)元素看起來很不尋常。如果它會在'img'前面,這會給你一個答案:'soup.find('td',{'id':'bxgy_x_img'})。findChild('img')['alt']',這將簡單地打印*標題*。 – miku 2012-01-13 18:37:24