2010-01-22 29 views
0

我正在用BeautifulSoup編寫HTML文檔,我希望它不要將內嵌文本(如<p>標記內的文本)拆分爲多行。我得到的問題是,解析<p>a<span>b</span>c</p>與美化給我的輸出在BeautifulSoup中進行內聯語法分析

<p> 
    a 
<span> 
b 
</span> 
c 
</p> 

現在的HTML顯示A,B,C,這是我不希望之間的空格。我如何避免這種情況?

回答

2

如何根本不使用prettify

BeautifulSoup.BeautifulSoup('<p>a<span>b</span>c</p>').renderContents() 

輸出原始的HTML,沒有多餘的空格。您可以使用例如稍後Firebug將仔細研究文檔的結構,而無需在施工時「美化」它。

0

我只是做:

from BeautifulSoup import BeautifulSoup 

ht = '<p>a<span>b</span>c</p>' 
soup = BeautifulSoup(ht) 
print soup 

,並避免得到任何額外的空格。 prettify的工作完全是調整空白以清楚地顯示HTML分析樹的結構,畢竟...!