按照我剛纔的問題搜索在JavaScript字符串: how to fetch javascript contents in python使用python
我試圖讓另一個腳本從一個javascript獲取數據。當然得到了網頁內容。
但是,它只是沒有顯示我想要的內容。我想從頁面的javascript中找到「content_id」。這是網頁: - http://www.hulu.com/watch/815743
這就是我現在所擁有的。
import re
import requests
from bs4 import BeautifulSoup
import os
import fileinput
Link = 'http://www.hulu.com/watch/815743'
q = requests.get(Link)
soup = BeautifulSoup(q.text)
#print soup
subtitles = soup.findAll('script',{'type':'text/javascript'})
pattern = re.compile(r'"content_id":"(.*?)"', re.MULTILINE | re.DOTALL)
script = soup.find("script", text=pattern)
print pattern.search(script.text).group(1)
我得到這個錯誤:
AttributeError: 'NoneType' object has no attribute 'text'
不知道如何解決這個問題..?
你有沒有考慮尋找*「AttributeError的:‘NoneType’對象有沒有屬性」 *?那裏已經有很多類似的問題了... – jonrsharpe
我試過了解決方案...沒有工作。 – Xonshiz
我從字面上不相信你 - 即使你真的*已*嘗試了所有的各種建議,爲什麼你不在問題中提到*? – jonrsharpe