2017-09-27 18 views
0

試圖在打印輸出中抓住特定名稱。截至目前,代碼是這樣的......從循環中抓取特定單詞/打印

links = page_soup.findAll('div', attrs={'class' : 'gameLinks'}) 
for div in links: 
    print div.find('a')['href'] 

上面的代碼抓住所有的鏈接,給我大致50個鏈接,我只是想包含在URL中的單詞「redzone後面」等等。以下是其中包含redzone的鏈接的示例。

http://example.com/247075/1/nfl-redzone-live---never-miss-a-touchdown-live-stream-online.html 
http://example.com/247075/2/nfl-redzone-live---never-miss-a-touchdown-live-stream-online.html 

我在這裏錯過了什麼?

+0

'link_href = div.find('a')['href'];如果link_href中的'redzone':print link_href' – mshsayem

回答

2

嘗試,如果「子」的字符串,以查看是否一個字符串包含的子字符串:

links = page_soup.findAll('div', attrs={'class' : 'gameLinks'}) 
for div in links: 
    link = div.find('a')['href'] 
    if "redzone" in link: 
     print link 

您還可以使用正則表達式,因爲這是區分大小寫的,它更復雜,但更強大! https://docs.python.org/3/howto/regex.html

+0

這樣做 - 非常感謝你。快速的問題,我怎樣才能將該打印附加到一個CSV文件,而不用寫我已經有的東西?這意味着,在這行代碼之前,我已經打印到一個csv文件,並希望將下一個代碼打印到相同的csv文件中而不會覆蓋它。 :) –

+0

我會先把一切都添加到一些數據對象中,比如數組或字典,然後在程序輸出到CSV的最後。我對CSV文件沒有太多的經驗,但如果可以的話,我只會寫一次文件。希望有所幫助! – Asleepace

+0

謝謝。我會研究一下。至於「redzone」這個詞,是否區分大小寫? –