我想第一次在Java中使用正則表達式。 我想獲得一些字符串的一部分。該字符串是一個有點複雜:java正則表達式得到字符串的某些部分
<description>
<a href='http://testlink.html' alt='some text'><img border='0'
src='http://s2.glbimg.com/zzag70iNYX-QK24sUp0YXQmmXhx7yb8j2Sq2YK7tvX3A6vCwEUOFnFTBONQFT-
ni/s.glbimg.com/es/ge/f/original/2012/04/25/image.jpg'
alt='some' title='text' /></a><br />some text; some text
</description>
我需要的是拿到位於字符串HREF和ALT。爲此我正在做這樣的代碼:
for(Element element : elements)
{
//Elements children = element.children();
Pattern pattern = Pattern.compile("a\\bhref=*(.html|.htm)>");
String[] data = pattern.split(element.text()); ...
}
等等。目前,我只想取得成功,但只能獲得href。回報總是整個字符串。不正確?我已經把html擴展保證,並沒有發生。
如果你打算解析html,爲什麼不使用[現有的html解析器](http://htmlparser.sourceforge.net/)? – Thomas 2012-08-08 20:36:56