2016-06-12 80 views
0
public static void main(String[] args) throws IOException { 
    Document doc = Jsoup.connect("https://www.google.com/search?q=tesla&oq=tesla&aqs=chrome.0.69i59l3j0l3.494j0j9&sourceid=chrome&ie=UTF-8#q=tesla&tbm=nws").userAgent("Mozilla").get(); 

    Elements links = doc.select("div[class=_cnc]"); 
    for (Element link : links) { 
     Elements titles = link.select("h3.r_U6c"); 
     String title = titles.text(); 
     System.out.println(title); 
     System.out.println("Headline: " + link.text()); 
     System.out.println("Link: " + link.attr("data-href")); 
    } 
     }} 

這裏是HTMl佈局。我想爲每個鏈接提取標題。我只是不確定如何格式化我的代碼的CSS選擇器部分。我試圖查看一些舊線程,但無法獲得任何工作。我只是在尋找標題的文字而不是實際的鏈接。打印鏈接聲明僅用於一些我無法運行的測試。如何從谷歌新聞搜索使用Jsoup獲得所有的頭條新聞

謝謝你們 Picture of HTML

回答

0

你想獲取的頁面加載的JavaScript。 Jsoup不處理JavaScript腳本。

請使用一些工具,如Seleniumui4j