2012-07-27 39 views
0

我有一個我正在開發的IRC bot,我希望它具有的一個功能是採取任何人員鏈接並使用BeautifulSoup來解析該頁面。現在,我有機器人工作,獲取人們發佈的消息等。但是,我將如何從IRC消息中獲取鏈接?說有人這樣說:試圖隔離來自IRC消息的鏈接

人:退房http://www.site.com,很酷!

我該如何取出鏈接並將其分配給一個變量供以後使用,而不需要拉動消息的其他部分?

我認爲這與正則表達式有關,但我不確定。

回答

1

你確實需要使用正則表達式。

有一個體面的文章,用於匹配URL的正則表達式,並且有一些描述它在daring fireball處的做法。

你可以看看Django如何去做here

最後,Python的正則表達式documentation也可能有用。

+0

Gruber的URL正則表達式是我想到的第一件事情。好答案! – 2012-08-01 22:08:43

0

您正在準確結束這件事。你給你自己的問題最後一句話的答案。您將使用捕獲組的正則表達式來獲取url,然後您可以解析/抓取用戶在irc中說過的頁面。

這個網站可能是一些使用的爲您提供:http://www.regular-expressions.info/