2012-10-23 8 views
1

我試圖從YouTube的Java API獲取交互式腳本(如果可用)視頻,但這樣做很少成功,因爲我找不到通過API獲取它的方式。爲YouTube視頻獲取交互式腳本

因此,我嘗試使用JSoup提取頁面後使用HTML解析器解析頁面(搜索id =「transcript-scrollbox」的元素),但這不起作用,因爲頁面不包含任何具有此id的元素。

Document doc = Jsoup.connect(pageUrl).get(); 

Element transcriptScrollBox = 

doc.select("div[transcript-scrollbox]").first(); 
//doc.getElementById("div#transcript-scrollbox"); 
if(transcriptScrollBox!=null) 
    System.out.println("element in trnascript = " + transcriptScrollBox.text()); 

例如在this video來自汗學院概率有一個按鈕,其顯示所述交互式腳本此視頻。我提取了這個URL的頁面內容,然後嘗試搜索元素。交互式腳本不是頁面的一部分(可能是因爲元素transcriptScrollBox始終爲空)。如果是的話,我該如何獲取數據?

任何人都可以指出我的方向或幫助我實現目標。

+0

您可以發佈您從YouTube API嘗試的代碼以及遇到的錯誤/問題嗎? –

+0

對不起,我猜錯誤的方式表達了這個問題。由於我找不到通過API獲取腳本的方法,我想到解析頁面。它可以通過API來完成嗎? – Egalitarian

回答

0

我們不會通過YouTube API公開這些數據,我也不會主張任何自動化解決方案來刮擦YouTube網站。很抱歉讓人失望。

+0

如果你可以暴露這個,那麼它會很棒。在我留下的地方;在網絡連接速度不是很快的情況下,我們可以下載視頻並將其存儲到存儲庫中。稍後,某些用戶可以使用交互式腳本來了解視頻中指導者聲音不太清晰或速度太快而無法理解的部分。您是否打算很快添加它? – Egalitarian

+0

如果搜索中包含交互式抄本,這將非常有幫助。神聖的抽菸,它會讓它更容易找到我想要的東西! –