Beautifulsoup noob here。只是爲了練習,我試圖在這裏提取this page的包和版本列。我嘗試使用:table = soup.find('table', attrs={'class': 'listing sortable'})
獲取表格內容,但我並沒有真正獲得任何有價值的數據..我很迷茫。如何使用beatifulsoup提取表格列和行python
0
A
回答
2
import requests
import bs4
url = 'https://launchpad.net/~openshot.developers/+archive/ubuntu/ppa'
res = requests.get(url)
res.raise_for_status()
soup = bs4.BeautifulSoup(res.text, "html.parser")
tbody = soup.find_all(id='packages_list')[0].tbody
for tr in tbody.find_all('tr'):
package = tr.find_all('td')[0].contents[2].strip()
version = tr.find_all('td')[1].contents[0].strip()
print('{0} - {1}'.format(package, version))
1
table = soup.find("table", id="packages_list")
row_data = []
for row in table.find_all("tr"):
cols = row.find_all("td")
cols = [ele.text.strip() for ele in cols]
row_data.append(cols)
我不知道是什麼結果你得到的權利,但嘗試了這一點!
1
可以遍歷tr
標籤和解壓包和版本:
table = soup.find('table', attrs={'class': 'listing sortable'})
package = '' ; version = ''
for i in table.select('tr'):
data = i.select('td')
if data:
package = data[0].text.strip()
version = ' '.join(data[1].text.strip().split())
print('{} : {} '.format(package,version))
#output
libopenshot : 0.1.4+0+588+107+201703310338+daily~ubuntu17.04.1
libopenshot : 0.1.4+0+588+107+201703310338+daily~ubuntu15.04.1
libopenshot : 0.1.4+0+588+107+201703310337+daily~ubuntu16.10.1
libopenshot : 0.1.4+0+588+107+201703310337+daily~ubuntu16.04.1
...
...
相關問題
- 1. beatifulsoup從網頁中提取數據python
- 2. 使用Python提取HTML表格BeautifulSoup
- 3. 如何使用Python以ODT(OpenDocumentText)格式提取表格,文本和圖片?
- 4. 如何從列表python中提取值?
- 5. 提取HREF從屬性與BeatifulSoup
- 6. 使用Python進行提取和分組
- 7. 使用正則表達式和python提取編號列表(多行)
- 8. 使用python和lxml從表格中提取文本
- 9. 如何使用Python提取網頁數據,BeautiflSoup和從表格中機械化
- 10. 如何使用jquery提取錶行值
- 11. 如何使用正則表達式提取多行文字python
- 12. Python:使用BeatifulSoup從數據綁定中獲取數據
- 13. 用於抓取表格列和行的Python Scrapy
- 14. 提取和使用Python
- 15. 提取和使用python
- 16. 提取使用Python和YouTubeAPI
- 17. 如何使用python來提取提及?
- 18. 如何使用python從iTunes中提取播放列表(文件位置列表)
- 19. 提取表和列名使用C#
- 20. 如何使用Python和BeautyfulSoup對HTML表格進行排序
- 21. 如何使用Python中的空格和新行將文件分割成列表?
- 22. 在BeautifulSoup中只提取表(td)中的特定行和列,python
- 23. 如何使用Python列表?
- 24. 使用beatifulsoup刮地圖coordiantes
- 25. 使用SeleniumDriver提取給定表元素的所有行和列
- 26. 如何使用cut和awk命令以表格格式提取文本輸入?
- 27. 比較2表格和僅提取表格2唯一的行
- 28. 如何在表格行和列中使用Jquery添加對象
- 29. 如何使用Ireport創建包含行和列的表格?
- 30. 如何使用行和列實現表格