0
我想刮下面的網站,因爲XML的格式不正確,不包含所有的數據幀的數據進行解析,我需要:與機械化和Ruby
http://www.cafebonappetit.com/menu/your-cafe/pitzer
當我取與機械化的文件,但是,我只得到:
{meta_refresh}
{title "Collins | Claremont McKenna Cafés | Café Bon Appétit"}
{iframes}
{frames}
{links
#<Mechanize::Page::Link "Welcome" "http://www.cafebonappetit.com/">
#<Mechanize::Page::Link "Our Approach" "javascript://">
#<Mechanize::Page::Link
"Kitchen Principles"
"http://www.cafebonappetit.com/our-approach/kitchen-principles">
.....
}
不幸的是,我顯然需要得到什麼是表(我猜他們是iFrame中)英寸有什麼想法嗎?
謝謝!
頁面沒有任何框架或iFrame。 Mechanize只是報告有0個iframe,0個幀,N個鏈接和1個標題。要找到表格,只需使用'page.search('table')' –
謝謝! #railsnewb – AlexSBerman