2017-08-06 18 views
0

我有以下BeautifulSoup對象:BeautifulSoup:類似。頭(東西)函數在熊貓

from bs4 import BeautifulSoup 
import requests 
import re 

url = 'https://www.adviserinfo.sec.gov/IAPD/content/viewform/adv/Sections/iapd_AdvPrivateFundReportingSection.aspx?ORG_PK=161227&FLNG_PK=05C43A1A0008018C026407B10062D49D056C8CC0' 
html = requests.get(url) 
soup = BeautifulSoup(html.text, "lxml") 

我在找什麼東西像熊貓了。頭()函數。我想在框架的頂部看到一些東西,但對象太長,無法滾動到頂部。

我已經找遍了,但我還沒有找到任何東西。任何幫助表示讚賞。

+0

* what *的前幾行 –

+2

這是一個很好的想法,但與熊貓不同,這不是平坦的,而是分層數據。你可以做一些像'soup.prettify()。splitlines()[:20]' –

+0

你想要什麼類型的輸出?你*可以*簡單地截斷html,但你不需要'BeautifulSoup'(並且它也不是有效的html)。 – SwiftsNamesake

回答

2

這個問題不是特定於BeautifulSoup,它截斷字符串作爲@cᴏʟᴅsᴘᴇᴇᴅ的問題說:

numlines = 20 
print('\n'.join(soup.prettify().splitlines()[:numlines])) 

調整numlines需要。您也可以使用html.text,因爲我們沒有以任何方式處理文檔的結構。