2016-10-06 46 views
0

我正在用Python 3.5製作一個簡單的腳本,它會要求標題(例如一首歌),它會在youtube.com/results?search_query=my+title並提取html代碼。Python:列出來自提取的HTML的YouTube視頻標題和URL

這就是我做什麼,但現在我面臨的一個問題:我想我的腳本列出視頻命題稱號並註冊相應的鏈接,所以例如,它給了我這樣的

搜索列表: 「EAZY E」

  1. EAZYë - 真muthaf ***** G公司
  2. EAZYë - 男孩在大罩等。

插入視頻的數量:我用urlib

這裏的問題是,我的HTML代碼巨大的負荷,我不知道如何列出我想要有什麼...

.request.urlopen(「http://youtube.com/results?search_query=」 + url_search_content)提取html代碼

請幫

+0

你使用的是什麼版本的python? – PrestonM

+0

看起來鏈接存儲在'class =「之前的'href'中*您可以使用BeautifulSoup找到並提取URLS –

+0

@PrestonM Python 3.5 – GriffinBabe

回答

0

您可以使用內置的HTMLParser庫在Python中提取包含你想要的視頻標題標籤。這個庫將給你多種方式來解析標籤,併爲你提供更清晰的可讀輸出。

https://docs.python.org/3/library/html.parser.html

請記住儘管這YouTube搜索結果往往是多頁內容,而你的HTML結果只會是這些網頁之一。

+0

謝謝!對我知道那個 :) – GriffinBabe