我今天開始用JSoup寄情。所以作爲一個例子,我開始從這個site刮取代理。更好的方法來與Jsoup刮
玩了很多之後,我能夠抓取代理,但沒有他們的端口號,因爲他們正在使用JavaScript。我想知道我們是否可以用JSoup來挖掘這些端口號。由於這是我第一次嘗試,我想知道我採取的方法是否正確。所以我發佈了可以獲取代理的代碼。
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import org.jsoup.safety.Whitelist;
public class ListLinks
{
public static void main(String[] args)
{
try
{
Document doc = Jsoup.connect("http://www.samair.ru/proxy/socks01.htm").get();
Elements content = doc.select("table.tablelist tbody tr ");
for(Element com: content)
{
Element fi=com.select("td").first();
String e=fi.text();
String safe=Jsoup.clean(e,Whitelist.basic());
System.out.println(safe);
}
}
catch(Exception e)
{
System.out.print("Problem");
}
}
}
這應該去[CodeReview](http://codereview.stackexchange.com/) – newfurniturey