2016-03-17 59 views
1

我開始使用rails機械化刮網站。有一個問題是,我需要得到簡單的數據,我不能找到任何例如如何讓它在這個真實的數據:rails機械化搜索沒有javascript和單個數據發現

<table cellpadding=0 cellspacing=1 border=0 width="100%"> 
    <tr> 
    <td width="20%" align=center> 
     <FONT FACE="arial,verdana,helvetica" SIZE="2">Car kg 
     <br><b>2340</b> 
    </td> 
    </tr> 
</table> 

我需要得到這個2340號碼。沒有Id或類,所以我應該如何得到這些信息?

而另一個問題是在另一個網站上。這是右鍵單擊受保護的網站。所以啓用JavaScript,我無法獲取源代碼。在Chrome上,如果我禁用JavaScript,我可以看到源代碼。但隨着機械化我不知道如何獲取數據。它說沒有內容。因爲啓用了JavaScript,實際上無法獲得任何內容。如何禁用JavaScript?捲曲是同樣的問題。

回答

1

如果您使用的是chrome,則可以使用開發人員工具來提供幫助。我相信Firefox也存在類似的東西。

打開開發工具,然後單擊「元素」選項卡。你會看到一個頁面源。

單擊開發工具左上角的按鈕以啓動「檢查器」,然後在實際網頁上單擊目標文本。這應該在開發工具視圖中突出顯示DOM節點。

然後右鍵單擊開發工具中選定的DOM節點。將鼠標懸停在「複製」上即可找到copy selector選項。點擊此按鈕可以將CSS選擇器添加到剪貼板 - 粘貼到任意位置查看。

這種方法在這種情況下特別有用 - 手工編寫CSS選擇器會很困難。

至於你的第二個問題 - 使用與Javascript依賴的機械化網站,我不知道是否有簡單的解決方案。您可能需要使用Capybara,Selenium或PhantomJS。