我目前正在基於watin構建一個小應用程序,登錄到一個網站,然後開始瀏覽一系列URL以使用Watin下載PDF文件。C# - 比watin更好的方式使用Javascript從域中抓取PDF文件
該網站使用了大量的JavaScript來加載嵌入式HTML中的PDF。
程序工作正常,但現在是很慢的,因爲華廷不能非常有效地處理下載(它使用Firefox的下載系統,並保存前慢慢鍵入文件名。
我想知道是否有一個更好的框架爲網頁報廢,可以提供相同的支持阿賈克斯網站,但更好/更快的方式下載文件。
我一直在網絡上發現硒,但它並沒有表現出更有效watin關於文件下載。
在此先感謝您爲他LP。
您可能會更好地瞭解源HTML頁面中PDF文件鏈接的位置/方式。可能你可能會更好使用HtmlAgilityPack,並以這種方式刮頁(儘管你必須放棄JavaScript)。如果您讓我們知道您正在試圖抓取的網站,可能會更容易。 –
您是否嘗試過[Selenum的Chrome驅動程序](http://code.google.com/p/selenium/wiki/ChromeDriver)?根據我的經驗,它比watin快。 – lstern