0
在C#應用程序中,我想打開一個url並下載pdf。C#從ajax驅動的url下載pdf
當這個URL從瀏覽器中被點擊時,頁面快速加載並開始我認爲是ajax調用。幾秒鐘後,瀏覽器下載提示與PDF文件一起出現。
我試圖通過WebClient打開這個網址。我返回的流不是PDF文件,它是頁面的實際HTML。
如何檢測PDF文件是否已加載並下載?
在C#應用程序中,我想打開一個url並下載pdf。C#從ajax驅動的url下載pdf
當這個URL從瀏覽器中被點擊時,頁面快速加載並開始我認爲是ajax調用。幾秒鐘後,瀏覽器下載提示與PDF文件一起出現。
我試圖通過WebClient打開這個網址。我返回的流不是PDF文件,它是頁面的實際HTML。
如何檢測PDF文件是否已加載並下載?
如果我沒有弄錯,WebClient對JavaScript沒有任何線索,它根本不會運行AJAX代碼,它只是獲取頁面的HTML並將其留在那裏。 而且由於PDF的URL可能是由Javascript解析的,或者PDF是根據需要生成的,甚至可以通過流式生成Javascript,所以您確實需要支持活動內容。
這看起來像硒一樣會很好。 http://www.seleniumhq.org/ 它會產生一個實際的瀏覽器,並引導瀏覽器到你需要的內容或運行PhantomJS無頭瀏覽器並獲取你想要的內容。
這可能有點矯枉過正,更有知識的人可能會有更好的答案,但這正是我用於需要從許多不同網站獲取PDF,CSV和其他文件的應用程序。