bs4

    1熱度

    1回答

    我在Python中使用BeautifulSoup4來解析一些HTML代碼。我設法鑽取到正確的表格並識別td標籤,但是我面臨的問題是標籤中的style屬性不一致地應用,並且使獲取正確td標籤的任務成爲真正的挑戰。 我試圖拉的數據是一個日期字段,但任何時候都會有多個使用CSS隱藏的td標籤(可見的取決於在HTML代碼中選擇的其他選項值)。 實際例子: <td style="display: none;

    -2熱度

    2回答

    import requests from bs4 import BeautifulSoup ''' It's a web crawler working in ebay, collecting every single item data ''' def ebay_spider(max_pages): page = 1 while page <= max_page

    0熱度

    1回答

    import requests from bs4 import BeautifulSoup url = "http://bet.hkjc.com/football/index.aspx?lang=en" r = requests.get(url) soup = BeautifulSoup(r.content, "html.parser") div = soup.find("div"

    -1熱度

    1回答

    的UserWarning消息每次我做的湯頁面與蟒蛇BS4一個源代碼,終端顯示: /usr/local/lib/python3.4/dist-packages/bs4/__init__.py:181: UserWarning: No parser was explicitly specified, so I'm using the best available HTML parser for thi

    1熱度

    1回答

    我想檢索SDMX文件(如https://www.bundesbank.de/cae/servlet/StatisticDownload?tsId=BBK01.ST0304&its_fileFormat=sdmx&mode=its)中給出的數據。我試圖使用BeautifulSoup,但看起來,它沒有看到標籤。在下面的代碼 import urllib2 from bs4 import Beautif

    1熱度

    3回答

    我正在學習Django,並且我正在使用Mac上的PyCharm中的bs4。我使用Python3和Django,它也安裝了bs4,它可以在下面看到。 但是,當我運行該項目,它會引發一個錯誤,說bs4不存在,可以在下面看到。 我已經嘗試了很多方法,它不能讓它工作。幫助

    3熱度

    2回答

    我遇到了與pro-football-reference.com相關的問題。我試圖訪問「團隊進攻」表,但似乎無法定位div/table。 我能做的最好的是: soup.find('div', {'id':'all_team_stats}) 不返回表中,也不是直接的div包裝。下面嘗試返回「無」: soup.find('div', {'id':'div_team_stats'}) soup.fi

    1熱度

    1回答

    我試圖創建一個腳本,檢查網站上的項目的股票,即時嘗試找到每一行中有「ATS」,包括冒號後的數字。然後我想打印「ATS」(每個大小爲一個值),這裏的所有值是腳本,我到目前爲止有: import requests from bs4 import BeautifulSoup prodpage=requests.get('http://www.adidas.com/on/demandware.sto

    1熱度

    1回答

    湊到網會員 所以我試着去湊這個用戶天寒對他的評價酒店&餐館分別 https://www.tripadvisor.in/members-reviews/rahuls896 現在的問題是,它顯示我在默認情況下所有的評論時,即時通訊通過BeautiFulsoup閱讀它。因此,默認情況下,class =「active」被分配給「REVIEWS_ALL」。 <li data-filter="REVIEWS_

    0熱度

    1回答

    當我通過Chrome手動導航到該網站後查看源HTML時,可以看到完整的頁面源代碼,但通過硒加載頁面源代碼時我沒有獲取完整的頁面源代碼。 from bs4 import BeautifulSoup from selenium import webdriver import sys,time driver = webdriver.Chrome(executable_path=r"C:\Pyt