0
音頻源鏈接我寫一個腳本來從一個網站的音頻源鏈接。通過抓取主頁面獲取可用鏈接的列表。但是當我抓取生成的鏈接時,我找不到源代碼。 (應該是內部的<音頻>標記的HREF)。獲取來自網站與Python
這裏是我的代碼:
# -*- coding: utf-8 -*-
import urllib.request
from bs4 import BeautifulSoup
def getHTML(st):
with urllib.request.urlopen(site+'/',timeout=100) as response:
return response.read()
site = 'http://www.e-radio.gr'
soup = BeautifulSoup(getHTML(site), 'html.parser')
# Parse Main Page And get links
lst = list()
for a in soup.body.find_all('a', {'class' : 'erplayer'}):
item = a.get('href')
if site in item:
lst.append(item)
else:
lst.append(site + item)
print("\n".join(lst))
看來,網站無法正確加載並使用urllib.request裏它不會加載音頻信號源。還有什麼我可以使用,而不是urllib.request,所以它等待整個頁面加載。我還以爲是使用一些外部Web瀏覽器來生成HTML,但我不知道該怎麼做
你可以發佈你需要的鏈接的HTML嗎?音頻鏈接html – Exprator
網站鏈接在代碼中。這是我的代碼,你可以運行它 –
權,但如果我們運行的代碼,我們可以看到印刷的音頻鏈接。問題是什麼? – alecxe