我有以下robots.txtPython的robotparser忽視的Sitemaps
User-agent: *
Disallow: /images/
Sitemap: http://www.example.com/sitemap.xml
及以下robotparser
def init_robot_parser(URL):
robot_parser = robotparser.RobotFileParser()
robot_parser.set_url(urlparse.urljoin(URL, "robots.txt"))
robot_parser.read()
return robot_parser
但是當我做了print robot_parser
以上return robot_parser
我得到的是
User-agent: *
Disallow: /images/
爲什麼它忽略了Sitemap線,我錯過了什麼?
是的,但我需要看看是否有指定的站點地圖來解析它們。我想我只需要通過urlopen打開機器人。謝謝。 – Ben 2010-06-04 22:29:04