我正在使用scrapy來抓取YouTube視頻,並且需要視頻的標題/描述語言。當我在this video上使用瀏覽器視圖源時,我可以在腳本標記內有一個變量'METADATA_LANGUAGE': 'no'
。我可以在scrapy和它的擴展中提取這個值,或者我應該下載並使用像beautifulsoup/htmlparser這樣的庫解析html。我如何提取scrapy中的javascript值
0
A
回答
0
根據this,您可以選擇帶有xpath/css的腳本文本,然後使用正則表達式搜索變量名稱。假設第一個腳本包含METADATA_LANGUAGE
:
items = response.xpath('//script/text()')[0].re(".*METADATA_LANGUAGE.*")
1
是的,這是可能的使用Scrapy。你可以看看this question。
有很多方法可以實現你要找的東西。一種方法是使用scrapy的選擇器獲取<script>
標籤,然後使用regex獲取您要查找的特定METADATA_LANGUAGE
變量。
相關問題
- 1. 如何提取scrapy
- 2. Scrapy從列表中提取鍵或值
- 3. Scrapy - 我如何從嵌套鏈接中提取信息
- 4. scrapy從javascript提取源代碼url
- 5. Scrapy - HTMLPathSelector,XPath中提取
- 6. 我如何從javascript中提取rapidminer xpath值
- 7. Scrapy如何提取樣式屬性?
- 8. 如何爲scrapy提供抓取網址?
- 9. 如何使用scrapy提取全價?
- 10. 提取串上scrapy
- 11. scrapy提取圖像
- 12. SCrapy提取數據
- 13. 提取href scrapy - 抓取但不提取
- 14. 我SGML鏈接提取不scrapy
- 15. 提取文本的XPath scrapy
- 16. 如何從Scrapy中提取網頁中的所有內容
- 17. Scrapy /從scrapy中隱藏的divs中提取數據
- 18. 如何使用javascript提取值?
- 19. 我如何提取美麗的值?
- 20. Scrapy - 獲取JavaScript的變量
- 21. Scrapy「Quotes Tutorial」 - 提取文本中的Unicode
- 22. 如何提取文本以及scrapy中的超鏈接文本?
- 23. Scrapy:如何提取嵌套div(xpath選擇器)中的內容?
- 24. 如何在scrapy函數中執行Javascript提交表單功能
- 25. 從JavaScript中提取表中的值
- 26. 如何從Javascript中的數組數組中提取值?
- 27. 如何提取中值?
- 28. 提取與XPath和scrapy
- 29. 如何從DOM中使用JavaScript提取元素值,如果我知道XPATH?
- 30. 如何提取值
如果您希望JavaScript生成的內容看Selenium。它使用瀏覽器獲取最終呈現的html,並將其返回scrapy進行刮取。 – Steve