2013-04-05 141 views
7

是否有一個很好的庫/包使用Scheme(最好是Racket)進行網絡抓取?網絡抓取計劃

例如一個相當於mechanize的計劃?

+0

可以將有效的HTML(讀取XML)輕鬆解析爲S表達式。 – leppie 2013-04-05 16:21:40

+0

好吧,但是提交html表單,導航鏈接等呢? – abeln 2013-04-05 16:23:09

+0

我相信Racket有一些http-client/web-client庫。 – leppie 2013-04-05 16:24:38

回答

7

我用球拍net/url庫的結合,html-parsing packageSXML(尤其是sxpath,對於XPath查詢)。其實,我寫了some wrappers圍繞網絡/網址,使它稍微容易使用,國際海事組織。

當我需要處理cookies時,我已經調用curl命令而不是使用net/url。