我有scraperwiki一個非常簡單的Python腳本:爲什麼scraperwiki會忽略被刮掉的html行?
import scraperwiki
import lxml.html
html = scraperwiki.scrape("http://www.westphillytools.org/toolsListing.php")
print html
我沒有寫任何東西來分析它尚未......現在我只想HTML。
當我在編輯模式下運行它完美的作品。
當一個計劃的Scrape運行(或我手動運行它)時,它會省略數十(甚至數百)行。
這是一個非常小的網頁,所以數據超載應該不成問題。有任何想法嗎?
你確定它不是一個如何在scraperwiki上處理印刷的假象嗎? – Marcin 2012-03-07 14:39:40
不確定...我在我的html輸出中間出現一行,它的內容如下所示 - 實際數字每次都不相同(括號中包括):[53行,159000個字符省略] – maneesha 2012-03-07 14:43:24
在scraperwiki文檔中找不到任何內容關於它 – maneesha 2012-03-07 14:44:55