我一直在列出需要用新內容更新的頁面列表(我們正在切換媒體格式)。在這個過程中,我正在對正確包含新內容的頁面進行編目。Python正則表達式「對象沒有任何屬性」
下面是我在做什麼的總體思路:
- 迭代通過的文件結構,並得到使用正則表達式搜索文件
- 對於讀取到緩衝區中的每個文件,列表,匹配特定標籤
- 如果匹配,測試2更正則表達式匹配
- 寫所得匹配(一個或另一個)到數據庫
一切工作正常,直到3日正則表達式匹配,在那裏我得到如下:
'NoneType' object has no attribute 'group'
# only interested in embeded content
pattern = "(<embed .*?</embed>)"
# matches content pointing to our old root
pattern2 = 'data="(http://.*?/media/.*?")'
# matches content pointing to our new root
pattern3 = 'data="(http://.*?/content/.*?")'
matches = re.findall(pattern, filebuffer)
for match in matches:
if len(match) > 0:
urla = re.search(pattern2, match)
if urla.group(1) is not None:
print filename, urla.group(1)
urlb = re.search(pattern3, match)
if urlb.group(1) is not None:
print filename, urlb.group(1)
謝謝。
啊。謝謝。我在代碼中使用了選項卡,該代碼由本網站的格式引擎重新格式化/重新解釋。 「url不是無固定它」 – ives 2009-09-29 17:10:04