我試圖從多個網址中提取特定的類。標籤和類保持不變,但我需要我的Python程序來抓取所有,因爲我只是輸入我的鏈接。使用美味的湯刮掉多個網址
這是我工作的一個樣本:
from bs4 import BeautifulSoup
import requests
import pprint
import re
import pyperclip
url = input('insert URL here: ')
#scrape elements
response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")
#print titles only
h1 = soup.find("h1", class_= "class-headline")
print(h1.get_text())
這適用於單個URL,但不是一個批次。感謝您的幫助。我從這個社區學到了很多東西。
我得到這個錯誤: 回溯(最近通話最後一個): 文件 「/Users/Computer/Desktop/test.py」,7號線,在 的url =輸入['HTTPS: //website.com/link1','https://website.com/link2'] TypeError:'builtin_function_or_method'對象不可訂閱 –
您打算從用戶那裏獲取每個網址的輸入嗎?如果沒有,那麼簡單地把所有的網址列表,如我的答案中所示。不要把輸入法中的列表。 – falloutcoder
我正在考慮用戶輸入分隔線? –