我有一些文本內容,其中包含一個URL列表。在Ruby中提取字符串中的所有網址
我想抓住所有的URL並將它們放入數組中。
我有這樣的代碼
content = "Here is the list of URLs: http://www.google.com http://www.google.com/index.html"
urls = content.scan(/^(http|https):\/\/[a-z0-9]+([\-\.]{1}[a-z0-9]+)*\.[a-z]{2,5}(([0-9]{1,5})?\/.*)?$/ix)
我試圖讓最終的結果是:
['http://www.google.com', 'http://www.google.com/index.html']
上面的代碼似乎並沒有正常工作。有誰知道我做錯了什麼?
感謝
我給你簡單。這可能是所有需要的。 – Chowlett 2010-02-19 16:35:58
我畢業於那所學校! – 2012-10-25 00:58:57
這種方法將會錯過許多有效的URL並錯誤地選擇許多無效的URL。 – sferik 2013-01-23 05:47:48