2017-10-28 61 views
0

我有一個html頁面。從文本文件解析json對象與其他東西 - Python

requests讀取並解析一個腳本標記與beautifulsoup,現在這個標籤有文字的負荷,有的卻是JSON對象。

如何從本文中讀取所有json對象?

我想實現的就是讓價格的產品從亞馬遜團購業務,這是我寫的,現在:

from bs4 import BeautifulSoup 
import json 
import requests 

def FindRightScriptTag(soup): 
    for tag in soup.find_all('script', type="text/javascript"): 
     if 'sortedDealIDs' and 'dealDetails' in tag.text: 
      return tag 

url = "https://www.amazon.co.uk/gp/deals/" 
r = requests.get(url) 
data = r.text 
soup = BeautifulSoup(data,"html.parser") 
tag = FindRightScriptTag(soup) 
print (tag) 

回答

0

將是一件好事,如果你分享了一些你的代碼。一般來說,如果你知道如何瀏覽你美麗的湯xml樹,你可以將你認爲是json的字符串傳遞給json module

json.loads()是你正在尋找的,因爲它需要一個json字符串將它變成Python對象字典供你使用。

+0

添加到主要帖子 –