有幾個可能的解決方案:
1)當你沒有明確你的意思urllib didnt work for this website
,你可以嘗試使用python-requests
庫,而不是:
使用pip install requests
與cmd
/Terminal
url = "http://shironet.mako.co.il/artist?type=lyrics&lang=1&prfid=202&wrkid=2473"
page_source = requests.get(url).content
2)嘗試禁用媒體文件自動播放與Firefox Preferences
:
from selenium.webdriver.firefox.firefox_profile import FirefoxProfile
profile.set_preference("media.autoplay.enabled", False);
driver = webdriver.Firefox(profile)
3)更粗暴的方法就是頁面上禁用Javascript
(我不知道你實際上可能需要這個描述的目的)
from selenium.webdriver.firefox.firefox_profile import FirefoxProfile
profile.set_preference("javascript.enabled", False);
driver = webdriver.Firefox(profile)
但要小心,因爲它可以刪除一些所需的媒體文件從頁面源
你正在使用什麼代碼來打開網頁..通常driver.get()方法等待,直到頁面加載 – thebadguy
嗨,即時通訊使用:driver.get(url),然後driver.page_source。但我不想等到頁面加載..我只想要源代碼 –