2017-08-09 61 views
1

我已經刮掉了html文件的一部分,並將它變成了BeautifulSoup對象。我想獲得它的文本內容,但是當有相鄰的div標籤時,它們會被加入而沒有空格,這很煩人,對我來說聽起來不合理。 例如:不同div標籤中的文本被加入而沒有空格

BeautifulSoup('<div>Hello</div><div>World</div>').get_text() 

這給你HelloWorld,不Hello World什麼的。 我該如何解決它?

+1

get_text函數幾乎可以帶走所有標籤,讓剩下的任何東西都留下 –

回答

1

你可以試試這個:

BeautifulSoup('<div>Hello</div><div>World</div>').get_text(' ') 

如果使用BS4那麼您可以在get_text加' '參數。欲瞭解更多解決方案,請查看this

+1

謝謝!正是我在找什麼 –

+0

沒錯。我爲什麼甚至做出這個變數 –

相關問題