抓住所有在「for」的末尾

是否可能有一個「catch all」語句影響所有尚未被for match in re.findall語句添加的語句。抓住所有在「for」的末尾

for submission in submissions: 
    print (submission.url) 
    for match in re.findall(".+imgur\.com+",submission.url): 
     NonFilteredImgurImageList.append(submission.url) 
    for match in re.findall("gfycat\.com",submission.url): 
     GfycatUrlList.append(submission.url) 
    else: 
     NonStandardUrlList.append(submission.url)

我試過以上，但沒有奏效。

有沒有辦法讓它工作或更好的方式來設置它（我打算隨着時間的推移添加更多的正則表達式搜索）。

來源

2017-01-01 Jakodns

究竟是「捕獲所有」？你的問題不清楚。 – Maroun

還要注意''。+ imgur \ .com +「'不是你想要的，它匹配''http：//imgur.commmmmmmmm''這樣的字符串。 –

一個'submission.url'可以包含多個url嗎？如果是這樣，你想單獨添加每一個還是僅僅提交提交（如同你有的，在多個url的情況下有效地複製）。 – kabanus

它看起來不像你需要一個正則表達式。實際上，如果那些re.findall調用實際上包含多個結果，則它會附加相應的submission.url字符串的副本。只需使用in。

for submission in submissions: 
    print(submission.url) 
    if 'imgur.com' in submission.url: 
     NonFilteredImgurImageList.append(submission.url) 
    elif 'gifycat.com' in submission.url: 
     GfycatUrlList.append(submission.url) 
    else: 
     NonStandardUrlList.append(submission.url)

如果正則表達式匹配實際上這裏需要的話，你會使用類似以下內容：

for submission in submissions: 
    i = re.findall(expression1, submissions.url) 
    g = re.findall(expression2, submissions.url) 
    if i: 
     results['imgur'] += i 
    elif g: 
     results['gfycat'] += g 
    else: 
     results['failures'].append(submissions.url)

來源

2017-01-01 09:02:36 TigerhawkT3

我想在技術上應該使用'urllib'解析來避免錯誤分類像'http：// nonstandard.example.com/i/look_what_i_found_on_imgur.com'這樣的URL，但這實際上超出了被問的範圍。 –

抓住所有在「for」的末尾

回答

相關問題