我有一個HTML文件,我想用Jsoup讀取並將結果導出到Excel工作表。在這個過程中,我想提取HTML文件中存在的所有圖像的鏈接(src)。Java:如何使用Jsoup庫爲Java提取HTML文件中的圖像鏈接
下面是我已經習慣了做同樣的代碼片段:
File myhtml = new File("D:\\Projects\\Java\\report.html");
//get the string from the file myhtml
String str = getFileString(myhtml);
//getting the links to the images as in the html file
Document doc = Jsoup.parseBodyFragment(str);
Elements media = doc.select("[src]");
//System.out.println(media.size());
for(Element imageLink:media)
{
if(imageLink.tagName().equals("img"))
//storing the local link to image as global variable in imlink
P1.imlink = imageLink.attr("src").toString();
System.out.println(P1.imlink);
}
}
我在HTML文件中的兩個圖像,我想您的鏈接。但是,我編寫的代碼僅顯示了文件中第一個圖像的鏈接。請幫我找出我的代碼中的錯誤!