我試圖搜索整個單詞PID中的鏈接,但有些這也是在這段代碼正則表達式搜索,如果條件
for a in self.soup.find_all(href=True):
if 'pid' in a['href']:
href = a['href']
if not href or len(href) <= 1:
continue
elif 'javascript:' in href.lower():
continue
else:
href = href.strip()
if href[0] == '/':
href = (domain_link + href).strip()
elif href[:4] == 'http':
href = href.strip()
elif href[0] != '/' and href[:4] != 'http':
href = (domain_link + '/' + href).strip()
if '#' in href:
indx = href.index('#')
href = href[:indx].strip()
if href in links:
continue
links.append(self.re_encode(href))
對不起,我的意思是正則表達式 –
我不清楚什麼是錯在這裏。你能清楚地知道你遇到問題的哪部分代碼,特別是它現在的行爲方式以及你希望它的行爲方式如何? – larsks
我認爲這可能是[子字符串測試字符串]的副本(http://stackoverflow.com/questions/5473014/test-a-string-for-a-substring) – C8H10N4O2