2012-12-11 30 views
0

現在,當我必須掃描或抓取視頻URL鏈接時遇到一些困難。該網頁使用基於Flash的技術來嵌入視頻和流媒體視頻。抓取嵌入式Flash視頻並呈現Javascript以獲取最終的GUI

爲了更清楚地理解,這是一個鏈接例如:

http://vnexpress.net/gl/the-gioi/tu-lieu/2012/11/bai-phat-bieu-thua-nhan-that-bai-cua-romney/

上述鏈路具有低於內容(用於Flash嵌入式視頻HTML代碼):

 <div id="flashContent" style="text-align:center;width:100%;">             
      <span id="FlashPlayer79237" class="Normal" align="center">B&#7841;n c&#7847;n c&#224;i <a href="http://www.macromedia.com/go/getflashplayer">Flash Player</a> &#273;&#7875; xem &#273;&#432;&#7907;c Clip n&#224;y.</span>    
     </div>   

在這種上面的文章,有一個以上的視頻。但是,當我試圖掃描或抓取內容時,視頻無法正常運行(因爲無法加載正確的視頻鏈接),只能顯示安裝Flash Player插件單詞(當然,真正的網頁需要運行一些Javascript腳本或Flash腳本來獲取真實視頻鏈接併爲用戶傳輸視頻)

因此,如何通過PHP或ASP.NET或Java渲染Flash和Javascript腳本?抓取網頁時如何獲得正確的視頻鏈接?在這種情況下,如何才能獲得正確的 Flash嵌入式視頻(HTML代碼)?

非常感謝。

+0

你應該包括一些你已經嘗試過的例子,以及你目前的解決方案在哪裏不足。 – Henrik

回答

0

在我回答之前,我想記下一點,如果你需要這些信息來做任何事情......請不要。

此外,對於特定的網站,這是相對容易的。

flashvars param(可能放在那裏的Javascript)包含一個名爲xmlPath的值,它是一個url編碼路徑(相對於他們的域名)。如果你抓住這和解碼它,你喜歡的東西:

/Service/FlashVideo/PlayListVideoPage.asp?id=79237&f=108&t=1 

如果你讀的是,它是包含實際視頻的URL的XML文件指向

http://vnexpress.net/Service/FlashVideo/PlayListVideoPage.asp?id=79237&f=108&t=1 

我不太確定那個值是從哪裏產生的。如果您需要在服務器端完成此操作,則可以使用無頭瀏覽器進行處理。

+0

感謝您的回答。但是,如果您下載網頁的內容,則無法看到以下參數:因此,我們無法跟蹤通過自己的方式的視頻鏈接。參數值是通過JavaScript腳本生成的,這是我對這個線程的問題。 –

相關問題