0
我想要廢除此鏈接中存在的所有不同圖像的url https://www.flipkart.com/samsung-galaxy-nxt-gold-32-gb/p/itmemzd4gepexjya?pid=MOBEMZD4KHRF5VZX。我正在用python的beautifulsoup模塊來嘗試它。但用這種方法沒有成功。我無法理解flipkart.com的代碼結構以及爲什麼它沒有返回所需的數據。 我試圖代碼是遵循如何取消在flipkart中存在的產品圖像的所有鏈接
from bs4 import BeautifulSoup
import urllib
from pprintpp import pprint
import pandas as pd
import requests
from time import sleep
x=requests.get("https://www.flipkart.com/samsung-galaxy-nxt-gold-32-gb/p/itmemzd4gepexjya?pid=MOBEMZD4KHRF5VZX").content
#x= urllib._urlopener("https://www.flipkart.com/jbl-t250si-on-the-ear-headphone/p/itmefbgezsc72mgt?pid=ACCEFBGAK5ZDTBF7&")
soup2 = BeautifulSoup(x, 'html.parser')
data=[]
for j in soup2.find_all('img', attrs={'class':"sfescn"}):
data+=[j]
print data
你能告訴我們你的代碼嗎? – Backtrack
請說明你到目前爲止所嘗試的? –
我想你只能得到2圖像鏈接。對 ? –