因此,我設法編寫了一個蜘蛛,從這個site中提取「視頻」和「英文抄本」的下載鏈接。看着cmd窗口,我可以看到所有正確的信息都被刮掉了。Python scrapy - 從回調到csv產生初始項目和項目
我遇到的問題是,輸出CSV文件只包含了「視頻」鏈接,而不是「英語成績單」鏈接(即使你可以看到它在cmd窗口被刮掉)。
我已經嘗試了其他帖子的一些建議,但他們都沒有工作。
下面的圖片是我想怎麼輸出看起來像: CSV Output Picture
這是我目前的蜘蛛代碼:
import scrapy
class SuhbaSpider(scrapy.Spider):
name = "suhba2"
start_urls = ["http://saltanat.org/videos.php?topic=SheikhBahauddin&gopage={numb}".format(numb=numb)
for numb in range(1,3)]
def parse(self, response):
yield{
"video" : response.xpath("//span[@class='download make-cursor']/a/@href").extract(),
}
fullvideoid = response.xpath("//span[@class='media-info make-cursor']/@onclick").extract()
for videoid in fullvideoid:
url = ("http://saltanat.org/ajax_transcription.php?vid=" + videoid[21:-2])
yield scrapy.Request(url, callback=self.parse_transcript)
def parse_transcript(self, response):
yield{
"transcript" : response.xpath("//a[contains(@href,'english')]/@href").extract(),
}
[Scrapy CSV輸出 「隨機」 缺場(可能的重複https://stackoverflow.com/questions/41917108/scrapy-csv-output-randomly-missing - 場) –