7
我想從網上刮一張桌子,並保持& nbsp;實體完好無損,以便稍後可以重新發布爲HTML。 BeautifulSoup似乎將這些轉換爲空間。例如:刮美麗的湯保存 實體
from bs4 import BeautifulSoup
html = "<html><body><table><tr>"
html += "<td> hello </td>"
html += "</tr></table></body></html>"
soup = BeautifulSoup(html)
table = soup.find_all('table')[0]
row = table.find_all('tr')[0]
cell = row.find_all('td')[0]
print cell
觀察結果:
<td> hello </td>
所需的結果:
<td> hello </td>
感謝您的回答:) – 2013-04-28 03:56:10