3
我有一個網頁抓取工具可以解析來自網站的html,我正在爲它編寫測試。使用RSpec和rails測試「HTML fixtures」
我試圖測試的類收到一個Nokogiri HTML對象,並從中提取所需的數據。像往常一樣,html可能會有所不同,有時元素將會丟失或者什麼都不會。我需要測試這些不同的情況。
所以我想要做的是製作一堆html文件,每一個都代表一個特定元素缺失的情況等。對於每個html文件,我希望也構建一個關聯的數據散列,我會假設刮刀正常工作,希望刮刀提取。
因此,我想編寫一個測試,它將迭代這些html文件,並將被測試類所提取的數據與預期數據進行比較,並報告它是否正確。
有關如何做到這一點的任何建議?