2017-09-10 106 views
0

我正在嘗試從javascript提取數據。 JS貌似 -scrapy從javascript提取源代碼url

<script type="text/javaScript"> 
var playerInstance = jwplayer("player"); 
playerInstance.setup({ 
    image: "http://cdn1.gomoviesgo.com/movies/1230451279-cover-Wonder-Woman.jpg", 
    sources: JSON.parse('[{"file":"http:\/\/stream.gomo.to\/home\/movies\/tt0451279.mp4","label":"720<sup>HD<\/sup>"}]'), 
    width: "100%" 
}); 
</script> 

我需要圖像URL是http://cdn1.gomoviesgo.com/movies/1230451279-cover-Wonder-Woman.jpg和源地址是"http:\/\/stream.gomo.to\/home\/movies\/tt0451279.mp4"

請指導。

+0

什麼是你的問題? – Siphalor

+0

我如何獲得這些數據。無法實現代碼。 –

+0

是你的蟒蛇嗎?你是否將'javascript.js'作爲一個純文本文件存放在你的scrapper中? –

回答

0

您不能使用html解析器解析js,但可以使用正則表達式。可以使用內置的re方法。

image = response.css('script::text').re('image:\s*"(.*?)",')[0] 
file = response.css('script::text').re('"file":"(.*?)",')[0].replace('\\', '')