2010-09-30 97 views
0

我需要使用C++中的正則表達式從HTML頁面中提取所有鏈接。有人可以幫我嗎?使用正則表達式查找文件中的鏈接C++

+1

可能的重複[正則表達式獲取鏈接在href中。 \ [asp.net \]](http://stackoverflow.com/questions/1496619/regex-to-get-the-link-in-href-asp-net) – 2010-09-30 19:47:09

+0

你看了[boost的正則表達式](http ://www.boost.org/doc/libs/1_44_0/libs/regex/doc/html/index.html)或[tr1](http://en.wikipedia.org/wiki/C%2B%2B_Technical_Report_1)正則表達式? – dgnorton 2010-09-30 19:48:26

+1

爲什麼你不得不爲這個任務使用正則表達式?有更合適的東西,比如解析器。 – 2010-09-30 20:04:15

回答

0

這對於一個正則表達式來說是一項艱鉅的工作,在C++中它更難。我實際上爲幾年前爲我上學的一個項目編寫了一個解析器。如果你發現它可以工作,你可以使用它,但是在你依賴任何重要的東西之前,我會根據你的想要測試它。

隨意修改/使用它,無論

我意識到在我的代碼一些錯誤,而且我也許應該包含頭文件。還包括cmakelists文件,但它是微不足道的。 ParserTest.cpp文件基本上允許您從命令行解析來自輸入字符串的鏈接。

http://www.mediafire.com/?0u5ppq0gzgdyg

+0

s/hard/impossible /。 – 2010-09-30 19:57:10

+1

同意。但這取決於你解析鏈接的含義。你想解析所有的鏈接?因爲使用正則表達式解析鏈接很好,所以只能保證不能正常工作=] – Falmarri 2010-09-30 20:05:39