我有一個我正在開發的IRC bot,我希望它具有的一個功能是採取任何人員鏈接並使用BeautifulSoup來解析該頁面。現在,我有機器人工作,獲取人們發佈的消息等。但是,我將如何從IRC消息中獲取鏈接?說有人這樣說:試圖隔離來自IRC消息的鏈接
人:退房http://www.site.com,很酷!
我該如何取出鏈接並將其分配給一個變量供以後使用,而不需要拉動消息的其他部分?
我認爲這與正則表達式有關,但我不確定。
我有一個我正在開發的IRC bot,我希望它具有的一個功能是採取任何人員鏈接並使用BeautifulSoup來解析該頁面。現在,我有機器人工作,獲取人們發佈的消息等。但是,我將如何從IRC消息中獲取鏈接?說有人這樣說:試圖隔離來自IRC消息的鏈接
人:退房http://www.site.com,很酷!
我該如何取出鏈接並將其分配給一個變量供以後使用,而不需要拉動消息的其他部分?
我認爲這與正則表達式有關,但我不確定。
你確實需要使用正則表達式。
有一個體面的文章,用於匹配URL的正則表達式,並且有一些描述它在daring fireball處的做法。
你可以看看Django如何去做here。
最後,Python的正則表達式documentation也可能有用。
您正在準確結束這件事。你給你自己的問題最後一句話的答案。您將使用捕獲組的正則表達式來獲取url,然後您可以解析/抓取用戶在irc中說過的頁面。
這個網站可能是一些使用的爲您提供:http://www.regular-expressions.info/
Gruber的URL正則表達式是我想到的第一件事情。好答案! – 2012-08-01 22:08:43