2016-01-22 116 views
0

我想刮上http://www.basketball-reference.com/teams/GSW/2016_games.html所有的「技術統計」鏈接刮鏈接。如果有人向我展示了一種方法來逐個點擊它們,那將是完美的,但只要刮掉它們就已經很棒了。 使用「a'結構選擇我設法爭取到從頁面所有鏈接:與casperjs/phantomjs

$('tbody tr a').each(function (i) { 
      console.log([i + 1, $(this).text(), ' // ' + $(this).attr('href')].join(': ')); 
     }); 

但我不明白的方式如何指定盒子得分鏈接

回答

0

這個選擇會做你想要什麼:

#teams_games > tbody > tr > td:nth-child(5) > a 

如果您使用Chrome開發者工具helpeful tip--,你可以右鍵點擊一個檢查單元,然後選擇複製>>複製選擇得到一個CSS選擇它。對於像這樣的案例來說,這通常是一個很好的起點。

+0

,我得到這個權利的感覺是虛妄的。我想製作一系列鏈接。這是我的代碼:scrape_links = function(){var_data = [];} $( '#teams_games TBODY TR TD:第n個孩子(5)')。每個(函數(){ 的Array.push($(本).attr( 'HREF')); }); return array; }和I調用內部這樣page.evaluate功能此功能:page.evaluate(函數(){ 鏈接= scrape_links(); });我收到一個錯誤:無法找到變量:scrape_links –