我已經找到了這個問題在stackoverflow和谷歌上的答案,找不到我在找什麼。我如何從網頁獲取特定文本
當我想從頁面檢索數據,像這樣的,有了這個代碼
public class ConsoleSearch {
public static void main(String[] args) throws IOException {
URL url = new URL("http://www.stackoverflow.com");
URLConnection cnt = url.openConnection();
BufferedReader br = new BufferedReader(new InputStreamReader
(cnt.getInputStream()));
String content;
while((content = br.readLine()) != null){
System.out.println(content);
}
br.close();
}
}
我明明得到了HTML標籤,一切隨之而來。 我可以很容易地過濾HTML使用HtmlCleaner
具有挑戰性的部分,我發現我的自我卡住的地方是當我想從所有檢索到的數據中檢索特定的文本。
例如,如果我只想檢索文字「Nova Scotia」和/或「Europe」......我該怎麼做?
你試過模式匹配 –
StackOverflow有一個[API](http://api.stackexchange.com/)。 –
謝謝安德魯。我不知道。 –