我已經刮掉了html文件的一部分,並將它變成了BeautifulSoup對象。我想獲得它的文本內容,但是當有相鄰的div標籤時,它們會被加入而沒有空格,這很煩人,對我來說聽起來不合理。 例如:不同div標籤中的文本被加入而沒有空格
BeautifulSoup('<div>Hello</div><div>World</div>').get_text()
這給你HelloWorld
,不Hello World
什麼的。 我該如何解決它?
我已經刮掉了html文件的一部分,並將它變成了BeautifulSoup對象。我想獲得它的文本內容,但是當有相鄰的div標籤時,它們會被加入而沒有空格,這很煩人,對我來說聽起來不合理。 例如:不同div標籤中的文本被加入而沒有空格
BeautifulSoup('<div>Hello</div><div>World</div>').get_text()
這給你HelloWorld
,不Hello World
什麼的。 我該如何解決它?
你可以試試這個:
BeautifulSoup('<div>Hello</div><div>World</div>').get_text(' ')
如果使用BS4那麼您可以在get_text加' '
參數。欲瞭解更多解決方案,請查看this
謝謝!正是我在找什麼 –
沒錯。我爲什麼甚至做出這個變數 –
get_text函數幾乎可以帶走所有標籤,讓剩下的任何東西都留下 –