BeautifulSoup：類似。頭（東西）函數在熊貓

我有以下BeautifulSoup對象：BeautifulSoup：類似。頭（東西）函數在熊貓

from bs4 import BeautifulSoup 
import requests 
import re 

url = 'https://www.adviserinfo.sec.gov/IAPD/content/viewform/adv/Sections/iapd_AdvPrivateFundReportingSection.aspx?ORG_PK=161227&FLNG_PK=05C43A1A0008018C026407B10062D49D056C8CC0' 
html = requests.get(url) 
soup = BeautifulSoup(html.text, "lxml")

我在找什麼東西像熊貓了。頭（）函數。我想在框架的頂部看到一些東西，但對象太長，無法滾動到頂部。

我已經找遍了，但我還沒有找到任何東西。任何幫助表示讚賞。

來源

2017-08-06 measure_theory

* what *的前幾行 –

這是一個很好的想法，但與熊貓不同，這不是平坦的，而是分層數據。你可以做一些像'soup.prettify（）。splitlines（）[：20]' –

你想要什麼類型的輸出？你*可以*簡單地截斷html，但你不需要'BeautifulSoup'（並且它也不是有效的html）。 – SwiftsNamesake

這個問題不是特定於BeautifulSoup，它截斷字符串作爲@cᴏʟᴅsᴘᴇᴇᴅ的問題說：

numlines = 20 
print('\n'.join(soup.prettify().splitlines()[:numlines]))

調整numlines需要。您也可以使用html.text，因爲我們沒有以任何方式處理文檔的結構。

來源

2017-08-06 23:10:34 SwiftsNamesake

BeautifulSoup：類似。頭（東西）函數在熊貓

回答

相關問題