我需要能夠提取標籤內的HTML內容,前提是我擁有網頁的網址。有什麼辦法可以使用Python來做到這一點?使用Python網頁抓取particualr標籤
-5
A
回答
0
有一個令人難以置信的拼搶庫Python中叫BeautifulSoup這將使你的生活變得更輕鬆:http://www.crummy.com/software/BeautifulSoup/
BeautifulSoup,您可以通過HTML標籤和/或HTML選擇通過CSS類名稱等屬性。它也能很好地處理壞html文檔,但是你需要閱讀關於它如何工作的文檔。這是非常令人驚訝的,你可以使用這個庫的幾行代碼進行刮擦。
玩得開心!
0
這是很容易做到這一點只使用urllib
來從網絡中的數據,然後使用BeautifulSoup解析出你需要
這裏的信息是一個例子:
import urllib2
from bs4 import BeautifulSoup
url = urllib2.urlopen('example.com')
soup = BeautifulSoup(url)
然後,你可以使用BeautifulSoup提取信息給定一個這樣的標籤
soup.find_all('tag_name')
也有很多其他的方式來提取數據,這個網站將有所幫助Web-Scraping with bs4
相關問題
- 1. 嵌套標籤網頁抓取python
- 2. 使用Python進行網頁抓取
- 3. 使用Python無法抓取網頁
- 4. 使用Python進行網頁抓取
- 5. 使用Python示例網頁抓取
- 6. Tripadvisor網頁抓取使用python
- 7. 如何使用BeautifulSoup通過網頁抓取seq標籤數據?
- 8. Python - 網頁抓取問題
- 9. 在python中抓取網頁
- 10. Python的網頁抓取 - UnicodeEncodeError
- 11. Python網頁抓取data-val?
- 12. 的Python - 網頁抓取 - BeautifulSoup
- 13. Python的SSL網頁抓取
- 14. Xpath Python網頁抓取
- 15. 網頁抓取,python和beautifulsoup
- 16. 使用vba抓取網頁
- 17. 使用JSoup網頁抓取網頁
- 18. 使用python抓取網頁中的標題
- 19. 用python 3抓取多個網頁?
- 20. Selenium/Web抓取/網頁抓取Python中的應用程序
- 21. Python網絡抓取:使用多個標籤提取一個屬性
- 22. Python網頁抓拍
- 23. 使用python從網站抓取多個網頁
- 24. Python - 使用Comet和HTTP流式網頁抓取頁面
- 25. 使用python進行網頁抓取以提取數據
- 26. 抓取Python中的html標籤時抓取
- 27. 抓取網頁的「預覽」 - Python
- 28. Python-完備數據(網頁抓取)
- 29. 在python下抓取IMDb的網頁
- 30. 在Python/R中的網頁抓取javascript
谷歌** python web刮**。 – Blender
可能重複的[HTML抓取的選項?](http://stackoverflow.com/questions/2861/options-for-html-scraping) – Anthon
重複。 http://stackoverflow.com/questions/1391657/python-web-scraping-involving-html-tags-with-attributes?rq=1 http://stackoverflow.com/questions/2081586/web-scraping-with -python?rq = 1 http://stackoverflow.com/questions/6969567/web-scraping-using-python?rq=1 – Logan