所以我「米用Python寫一個程序來拉評級的電影,從我最喜愛的網站之一在python中從鏈接過濾信息?
目前,我使用string.partition命令,以獲得HTML源代碼的部分,其中包含評級信息。然而,這種方法是極其緩慢。
會是什麼讓這部電影的評級最快的方法是什麼?
這裏是我的代碼m使用:
#POST Request to TOI site, for review source
data_output = requests.post(review_link)
#Clean HTML code
soup = BeautifulSoup(data_output.text)
#Filter source data, via a dirty string partition method
#rating
texted = str(soup).partition(" stars,")
texted = texted[0].partition("Rating: ")
rating = texted[2]
#title
texted = texted[0].partition(" movie review")
texted = texted[0].partition("<title>")
title = texted[2]
#print stuff
print "Title:", title
print "Rating:", rating, "/ 5"
謝謝!
使用實際的HTML解析器會很有幫助;像[BeautifulSoup](http://www.crummy.com/software/BeautifulSoup/bs4/doc/)。 –
發佈你的代碼的例子也將是有益的 – ScottJShea
我試過BeautifulSoup,但是,它需要更長的時間,因爲沒有真正的HTML標籤持有評級。相反,我不得不使用search_all方法,這同樣耗時。 –