我得到了下面的代碼:Reading新信息與urllib的
import urllib
import re
def worldnews():
count = 0
html = urllib.urlopen("https://www.reddit.com/r/worldnews/").readlines()
lines = html
for line in lines:
if "Paris" or "Putin" in line:
count = count + 1
print line
print "Totaal gevonden: ", count
print "----------------------"
worldnews()
我如何才能找到在標題與巴黎或Puttin在該網頁上的所有reddit的崗位。有沒有辦法將這個標題的帖子打印到控制檯?當我運行這個時候,我得到了很多html代碼。
看看[BeautifulSoup](http://www.crummy.com/software/BeautifulSoup/bs4/doc/) – Celeo
只是一個說明,行'如果「巴黎」或「普京」在行:'總是會返回True,這就是爲什麼你會得到很多HTML代碼。如上所述,使用BeautifulSoup或其他HTML解析庫 –