2016-02-28 61 views
1

我想查找並打印包含單詞「愛」的頁面中的鏈接列表。查找包含美味湯的搜索詞的鏈接

頁例如

<a href="http://example/foto-fujifilm/">i like love with you</a> 
<a href="http://example/foto-fujifilm/">i don't like love</a> 
<a href="http://example/foto-fujifilm/">love is my problem</a> 
<a href="http://example/foto-fujifilm/">i don't now</a> 

這是我的代碼

from bs4 import BeautifulSoup 
import requests 

url = raw_input("Enter a website to extract the URL's from: ") 

r = requests.get("http://" +url) 

data = r.text 

soup = BeautifulSoup(data,'lxml') 

for a in soup.find_all('a', string="*love*"): 
    print "Found the URL:", a['href'] 

如何使用通配符字符串搜索文本的愛情嗎?

回答

2

美麗的湯也接受正則表達式...

import re 

for a in soup.find_all('a', string=re.compile('love')): 
    print('Found the URL:', a['href']) 

和功能。

for a in soup.find_all('a', string=lambda s: 'love' in s): 
    print('Found the URL:', a['href']) 

編輯:

對於不區分大小寫的搜索:

re.compile('love', re.IGNORECASE) 

lambda s: 'love' in s.lower() 
+0

好的,謝謝你,人們還是不錯的,但我已經看到,如果我不需要密鑰,這個表達式對密鑰敏感敏感? – Lutty

+0

@Lutty:已更新。 – vaultah