2011-06-16 23 views
1

有沒有人知道一個快速的方法,我可以從Java的網頁獲取信息?例如,如果我正在查看這樣的頁面:http://www.ncbi.nlm.nih.gov/pubmed/?term=10952317並且我想提取標題「MeSH條款」下面的單詞列表,那我該怎麼做呢?如何從Java中的網頁獲取信息?

我有東西,可以讀取源,但它是完整的HTML標籤和這樣的......

任何幫助,非常感謝!

+0

[如何「掃描」一個網站(或網頁)的信息,並將其帶入我的程序?](http://stackoverflow.com/questions/2835505/how-to-scan-a-網站或頁面的信息,並把它帶入我的程序) – BalusC 2011-06-16 16:09:30

回答

3

正如之前在無數次看到JSoup這是一個Java的HTML解析庫一樣。或者寫你自己的(不推薦)。

+0

非常感謝! :) – NSP 2011-06-16 16:01:39

0

很可能TagSoup是給你的。

+0

謝謝!我會研究它。 – NSP 2011-06-16 16:01:49