從循環中抓取特定單詞/打印

試圖在打印輸出中抓住特定名稱。截至目前，代碼是這樣的......從循環中抓取特定單詞/打印

links = page_soup.findAll('div', attrs={'class' : 'gameLinks'}) 
for div in links: 
    print div.find('a')['href']

上面的代碼抓住所有的鏈接，給我大致50個鏈接，我只是想包含在URL中的單詞「redzone後面」等等。以下是其中包含redzone的鏈接的示例。

http://example.com/247075/1/nfl-redzone-live---never-miss-a-touchdown-live-stream-online.html 
http://example.com/247075/2/nfl-redzone-live---never-miss-a-touchdown-live-stream-online.html

我在這裏錯過了什麼？

來源

2017-09-27 James Dean

'link_href = div.find（'a'）['href'];如果link_href中的'redzone'：print link_href' – mshsayem

嘗試，如果「子」的字符串，以查看是否一個字符串包含的子字符串：

links = page_soup.findAll('div', attrs={'class' : 'gameLinks'}) 
for div in links: 
    link = div.find('a')['href'] 
    if "redzone" in link: 
     print link

您還可以使用正則表達式，因爲這是區分大小寫的，它更復雜，但更強大！ https://docs.python.org/3/howto/regex.html

來源

2017-09-27 02:59:04 Asleepace

這樣做 - 非常感謝你。快速的問題，我怎樣才能將該打印附加到一個CSV文件，而不用寫我已經有的東西？這意味着，在這行代碼之前，我已經打印到一個csv文件，並希望將下一個代碼打印到相同的csv文件中而不會覆蓋它。 :) –

我會先把一切都添加到一些數據對象中，比如數組或字典，然後在程序輸出到CSV的最後。我對CSV文件沒有太多的經驗，但如果可以的話，我只會寫一次文件。希望有所幫助！ – Asleepace

謝謝。我會研究一下。至於「redzone」這個詞，是否區分大小寫？ –

從循環中抓取特定單詞/打印

回答

相關問題