對於網頁:http://www.amazon.com/Harry-Potter-Prisoner-Azkaban-Rowling/dp/0439136369/ref=pd_sim_b_2?ie=UTF8&refRID=1MFBRAECGPMVZC5MJCWG 如何在python中刮取產品詳細信息並輸出dict。 在上述情況下,字典輸出我想有會: Age Range: 9 - 12 years
G
新來網絡抓取在這裏。我成功地颳了一個網站,但我遇到了一個問題。在文章類中,通常只有一個'p'標籤,但有時在文章類中隨機出現兩個或三個帶有一些不相關文本的'p'標籤。我想總是標記會出現這樣的: <p onclick="window.location.href = 'https://www.blahblah.com/somenumbers'">
some blah blah text
</p>
我想使用Ruby腳本來爲租借listings刮該頁面。我試過的一些不成功的方法是使用Nokogiri和Mechanize,但是瀏覽器只加載了14個列表,其餘的都是通過我認爲嵌入的JavaScript加載的。我簡單地看過rkelly,但沒有通過可用的課程閱讀。 這是我到目前爲止有: ##First Solution only returned 14 Results
require 'mechani