這是我們爲html解析編寫的程序。 它完美的作品。關於HTML解析的問題
我們在網上找到了一個演示程序,我們根據自己的需求對其進行了修改。 但我們不明白它是如何工作的。
import urllib
from urllib.request import urlopen
address='http://www.iitb.ac.in/acadpublic/RunningCourses.jsp?deptcd=EE&year=2012&semester=1'
print(address)
source= urlopen(address).read()
source=str(source)
from html.parser import HTMLParser
str1 = input('Enter name of prof:')
class MyHTMLParser(HTMLParser):
y=" "
def handle_data(self, data):
flag=0
x=str(data)
for i in range(len(x)):
if (x[i]=='\\'):
flag=1
break
if(flag==0) :
if(x==str1):
global y
print("Name of professor:",x)
print("Name of course:",y)
y=x
parser = MyHTMLParser(strict=False)
parser.feed(source)
我們的問題:
爲何類
HTMLparser
已經被擺在首位叫什麼?爲什麼函數
handle_data
被調用,該函數是如何工作的?爲什麼
global y
儘管y
是在類本身?