2010-03-25 52 views
0

我正在用java編寫一個應用程序我需要從網站提取特定數據。我不知道使用哪一個REGEX或Parser.Can是否有人請告訴我如何完成這個任務?哪一個是最好的。關於解析器DOM和REGEX

感謝

回答

1

肯定,得到一個HTML解析器

Here約幾個Java的HTML解析器一番比較。

他們中有些人在這裏

NekoHTML: 

final DOMParser parser = new DOMParser(); 
try { 
    parser.parse(new InputSource(urlIS)); 
    document = parser.getDocument(); 
} catch (SAXException e) { 
    e.printStackTrace(); 
} catch (IOException e) { 
    e.printStackTrace(); 
} 

TagSoup: 

final Parser parser = new Parser(); 
SAX2DOM sax2dom = null; 
try { 
    sax2dom = new SAX2DOM(); 
    parser.setContentHandler(sax2dom); 
    parser.setFeature(Parser.namespacesFeature, false); 
    parser.parse(new InputSource(urlIS)); 
} catch (Exception e) { 
    e.printStackTrace(); 
} 
document = sax2dom.getDOM(); 
+0

「SAX2DOM」的'import'在哪裏? – Martin 2011-06-19 07:57:36