bs4

1熱度

1回答

我在Python中使用BeautifulSoup4來解析一些HTML代碼。我設法鑽取到正確的表格並識別td標籤，但是我面臨的問題是標籤中的style屬性不一致地應用，並且使獲取正確td標籤的任務成爲真正的挑戰。我試圖拉的數據是一個日期字段，但任何時候都會有多個使用CSS隱藏的td標籤（可見的取決於在HTML代碼中選擇的其他選項值）。實際例子： <td style="display: none;

-2熱度

2回答

的Python BS4模塊

import requests from bs4 import BeautifulSoup ''' It's a web crawler working in ebay, collecting every single item data ''' def ebay_spider(max_pages): page = 1 while page <= max_page

0熱度

1回答

用bs4抓取網頁

import requests from bs4 import BeautifulSoup url = "http://bet.hkjc.com/football/index.aspx?lang=en" r = requests.get(url) soup = BeautifulSoup(r.content, "html.parser") div = soup.find("div"

-1熱度

1回答

避免顯示BS4庫

的UserWarning消息每次我做的湯頁面與蟒蛇BS4一個源代碼，終端顯示： /usr/local/lib/python3.4/dist-packages/bs4/__init__.py:181: UserWarning: No parser was explicitly specified, so I'm using the best available HTML parser for thi

1熱度

1回答

Python BS4與SDMX

我想檢索SDMX文件（如https://www.bundesbank.de/cae/servlet/StatisticDownload?tsId=BBK01.ST0304&its_fileFormat=sdmx&mode=its）中給出的數據。我試圖使用BeautifulSoup，但看起來，它沒有看到標籤。在下面的代碼 import urllib2 from bs4 import Beautif

1熱度

3回答

ImportError：django中沒有名爲bs4的模塊

我正在學習Django，並且我正在使用Mac上的PyCharm中的bs4。我使用Python3和Django，它也安裝了bs4，它可以在下面看到。但是，當我運行該項目，它會引發一個錯誤，說bs4不存在，可以在下面看到。我已經嘗試了很多方法，它不能讓它工作。幫助

3熱度

2回答

BeautifulSoup webscraper問題：找不到某些divs /表

我遇到了與pro-football-reference.com相關的問題。我試圖訪問「團隊進攻」表，但似乎無法定位div/table。我能做的最好的是： soup.find('div', {'id':'all_team_stats}) 不返回表中，也不是直接的div包裝。下面嘗試返回「無」： soup.find('div', {'id':'div_team_stats'}) soup.fi

1熱度

1回答

如何在美麗的湯搜索文本

我試圖創建一個腳本，檢查網站上的項目的股票，即時嘗試找到每一行中有「ATS」，包括冒號後的數字。然後我想打印「ATS」（每個大小爲一個值），這裏的所有值是腳本，我到目前爲止有： import requests from bs4 import BeautifulSoup prodpage=requests.get('http://www.adidas.com/on/demandware.sto

1熱度

1回答

嘗試使用BeautifulSoup

湊到網會員所以我試着去湊這個用戶天寒對他的評價酒店&餐館分別 https://www.tripadvisor.in/members-reviews/rahuls896 現在的問題是，它顯示我在默認情況下所有的評論時，即時通訊通過BeautiFulsoup閱讀它。因此，默認情況下，class =「active」被分配給「REVIEWS_ALL」。 <li data-filter="REVIEWS_

0熱度

1回答

在Selenium中無法查看完整的頁面源

當我通過Chrome手動導航到該網站後查看源HTML時，可以看到完整的頁面源代碼，但通過硒加載頁面源代碼時我沒有獲取完整的頁面源代碼。 from bs4 import BeautifulSoup from selenium import webdriver import sys,time driver = webdriver.Chrome(executable_path=r"C:\Pyt