2010-03-18 117 views
0

我目前正在設計一個專注的web爬行器。我有一些網站進行測試,直到我遇到了下面的錨(以下簡稱 「< A HREF =」 ... 「>):從Javascript獲取文檔HREFS

HREF =」 JavaScript的:使用openDocument( 'DATA // PCP200803.pdf'); 「

我的HTML解析程序結果

的javascript:使用openDocument( 'DATA // PCP200803.pdf');

沒有人有任何關於如何下載參考文件的想法?

非常感謝。

回答

0

openDocument()命令的情況下,你可以只添加「DATA/PCP200803.pdf」到其他資源的採集獲取/爬行,相同頁面中的任何其他超鏈接。其他JavaScript方法(例如XMLHttpRequest的open())可能並不那麼簡單。

+0

謝謝ImJasonH。我實際上期待的是,如果有一個很好的第三方實用程序可以提供更高級別的解析這些javascript hrefs,因爲我假設可能有很多這些類型的hrefs的不同實例。反正,tnx :) – Jojo 2010-03-18 06:45:22