2016-11-16 19 views
0

我想要廢除此鏈接中存在的所有不同圖像的url https://www.flipkart.com/samsung-galaxy-nxt-gold-32-gb/p/itmemzd4gepexjya?pid=MOBEMZD4KHRF5VZX。我正在用python的beautifulsoup模塊來嘗試它。但用這種方法沒有成功。我無法理解flipkart.com的代碼結構以及爲什麼它沒有返回所需的數據。 我試圖代碼是遵循如何取消在flipkart中存在的產品圖像的所有鏈接

from bs4 import BeautifulSoup 
import urllib 
from pprintpp import pprint 
import pandas as pd 
import requests 
from time import sleep 

x=requests.get("https://www.flipkart.com/samsung-galaxy-nxt-gold-32-gb/p/itmemzd4gepexjya?pid=MOBEMZD4KHRF5VZX").content 
#x= urllib._urlopener("https://www.flipkart.com/jbl-t250si-on-the-ear-headphone/p/itmefbgezsc72mgt?pid=ACCEFBGAK5ZDTBF7&") 
soup2 = BeautifulSoup(x, 'html.parser') 
data=[] 
for j in soup2.find_all('img', attrs={'class':"sfescn"}): 
    data+=[j] 
    print data 
+0

你能告訴我們你的代碼嗎? – Backtrack

+0

請說明你到目前爲止所嘗試的? –

+0

我想你只能得到2圖像鏈接。對 ? –

回答

1

嗯,我可以清楚地看到,有在網頁源代碼中移動的圖像沒有聯繫。 但我會建議使用工具Fiddler來跟蹤實際數據來自哪裏,最有可能它會來自json響應類型的請求。 我不熟悉beautifulsoup,我一直在使用scrapy。

相關問題