2009-07-22 66 views
1

我正在嘗試將任何頁面的源代碼加載到僅用於客戶端的HTML編輯器的文本框中。我需要能夠獲取網頁的整個來源,而不僅僅是身體。這YQL查詢返回只是身體:有沒有辦法使用yql獲取整個頁面的源代碼?

http://query.yahooapis.com/v1/public/yql?format=xml&callback=editor.handleLoad&q=select+*+from+html+where+url%3D%22example.com%22 

有沒有什麼辦法讓整個源,或是否有任何其他自由JSON-P-X Web服務,可以?

回答

1

我沒有看到用YQL做這件事的顯而易見的方式,但是這裏似乎是一種雅虎管道。它拒絕讓由他們的robots.txt的允許的網站,但它是爲獲得其他網站的整個源:

http://pipes.yahoo.com/pipes/pipe.info?_id=dCsGDO123hG6BNv70EypaA

默認設置爲www.example.com,這是因爲被拒絕該頁面上的robots.txt。但是,它接受URL作爲參數。下面是該管道將得到pipes.yahoo.com源並返回結果包裹在JSON的例子使用的鏈接:

http://pipes.yahoo.com/pipes/pipe.run?_id=dCsGDO123hG6BNv70EypaA&_render=json&url=http%3A%2F%2Fpipes.yahoo.com%2F

這是否幫助?

+0

更接近。該管道似乎過濾掉所有元標記和腳本標記。是否有任何代理/ web服務會返回整個頁面? – Craig 2009-07-22 19:00:42

相關問題