bs4

1熱度

1回答

一個例子網址爲「http://www.hockey-reference.com/players/c/crosbsi01/gamelog/2016」我試圖抓住被命名爲常規賽的表名。我用以前的情況下，需要做的就是這樣的事情... import requests from bs4 import * from bs4 import NavigableString import pandas as

0熱度

1回答

使用bs4從ID獲取PubMed數據

我正在從一個約12,000 PubMed ID的CSV文件下載標題，摘要，年份發佈和MeSH條款的項目。我已經寫了下面的代碼： import urllib2 from bs4 import BeautifulSoup import csv CSVfile = open('srData.csv') fileReader = csv.reader(CSVfile) Data = list(

0熱度

1回答

使用bs4的Scarping PubMed

我有一個PubMed ID的數據集（一個CSV文件），需要對它進行迭代，並且每個數據集都獲得標題，發佈年份，抽象和MeSH條款，然後我需要將其保存爲CSV具有以下格式的文件： id year_published title abstract mesh_terms 其中每個項目位於不同的單獨列中。我試圖使用BS4做到這一點，寫了這個： import urllib2 from bs4 imp

0熱度

2回答

Python2.7如何檢查響應是否是json（如果是，則解析它）？

我有一個'requests.models.Response'對象，我想解析它。在響應上調用response.json（）會生成一個「unicode」對象。主要 - 我如何檢查響應是否爲json？其次 - 我可以用bs4解析json'unicode'對象嗎？我的代碼如下： import requests post_hdrs = { 'type': 'regulated',

0熱度

1回答

來自GooglePlay輸出的Python篩選器軟件包名稱

我嘗試從GooglePlay中的搜索中過濾軟件包名稱。所以用戶輸入「Facebook」，我的腳本識別包名。我試着用BeautifulSoup4做到這一點。我認爲這是最好的解決方案。所以.. 這裏是我的代碼，我試圖 br = mechanize.Browser() br.set_handle_robots(False) br.addheaders = [('User-agent', 'chr

0熱度

1回答

即使我已經使用pip成功安裝了它，BeautifulSoup4仍然無法運行Linux Mint Sarah

我是一位全新的linux用戶，使用linux mint sarah，我剛剛安裝了python 3.5以及BeautifulSoup來做一些網頁抓取。然而，當我在下面的命令中鍵入我收到一個錯誤回溯：從BS4進口BeautifulSoup 錯誤告訴我，沒有模塊BS4。我也曾嘗試：進口BS4 從BeautifulSoup進口BeautifulSoup 進口beautifulsoup 這是奇怪的，

0熱度

2回答

使用python在HTML中找到CSS路徑（ancestor tags）

我想要在所有祖先div標籤中匹配文本。因此，例如，如果HTML看起來像HTML snippet 而我正在尋找「伯爵E.伯德」。我想獲得它包含{「買方信息」，「買方名稱」} 這是我做過什麼 r=requests.get(self.url,verify='/path/to/certfile') soup = BeautifulSoup(r.text,"lxml") di

4熱度

1回答

使用Python請求和美麗的湯拉文

感謝您抽出寶貴看看我的問題。我想知道是否有任何方式拉從這個文本數據sitekey ...這裏是鏈接到頁面https://e-com.secure.force.com/adidasUSContact/ <div class="g-recaptcha" data-sitekey="6LfI8hoTAAAAAMax5_MTl3N-5bDxVNdQ6Gx6BcKX" data-type="image" i

2熱度

1回答

Python 3美麗的湯找到冒號的標籤

我想刮這個網站，並得到兩個單獨的標籤。這就是html的樣子。 <url> <loc> http://link.com </loc> <lastmod>date</lastmode> <changefreq>daily</changefreq> <image:image> <image:loc> https://imag

0熱度

1回答

bs4.FeatureNotFound：找不到具有您請求的功能的樹型構建器：lxml

您能否建議修復？它幾乎從一張圖像下載imgur頁面中的所有圖像，不知道爲什麼它在這種情況下不起作用以及如何修復它？ elif 'imgur.com' in submission.url and not (submission.url.endswith('gif') or submission.url.endswith('webm') or submissio