問題:如何殺死一個實例或確保我正在創建一個新的python通用feedparser實例?不需要的python feedparser實例化遺蹟
信息:
我工作的一個程序,現在是下載和目錄大量的博客。它運行良好,除了一個不幸的錯誤。我的代碼設置爲獲取博客URL列表並通過for循環運行它們。每運行一次,它會挑選一個url並將其發送到一個單獨的類,該類管理將數據下載,提取和保存到文件。
第一個網址工作得很好。它下載整個博客並將其保存到文件中。但是下載的第二個博客也將包含第一個博客的所有數據,我完全不知道爲什麼。
代碼片段:
class BlogHarvester:
def __init__(self,folder):
f = open(folder,'r')
stop = folder[len(folder)-1]
while stop != '/':
folder = folder[0:len(folder)-1]
stop = folder[len(folder)-1]
blogs = []
for line in f:
blogs.append(line)
for herf in blogs:
blog = BlogParser(herf)
sPath = ""
uid = newguid()##returns random hash.
sPath = uid
sPath = sPath + " - " + blog.posts[0].author[1:5] + ".blog"
print sPath
blog.storeAsFile(sPath)
class BlogParser:
def __init__(self, blogherf='null', path='null', posts = []):
self.blogherf = blogherf
self.blog = feedparser.parse(blogherf)
self.path = path
self.posts = posts
if blogherf != 'null':
self.makeList()
elif path != 'null':
self.loadFromFile()
class BlogPeices:
def __init__(self,title,author,post,date,publisher,rights,comments):
self.author = author
self.title = title
self.post = post
self.date = date
self.publisher = publisher
self.rights = rights
self.comments = comments
我包括片段我想這可能是有用的。對不起,如果有任何令人困惑的文物。這個程序一直是一個痛苦的屁股。
+1非常有組織的問題 – jjj
謝謝,我試試。^_^ – Narcolapser