2012-10-20 42 views
1

我想從論壇主題中提取用戶帖子。僅限用戶文本。如何使用Jsoup或樣板從HTML頁面中提取?請給我一個解決方案。從論壇中提取用戶視圖

給我一個解決方案

回答

0
  1. 連接到網站,jsoup像張貼在這裏:http://jsoup.org/cookbook/input/load-document-from-url
  2. 使用選擇爲得到你需要的崗位。例如,所有可能的選擇名單都可以在這裏:http://jsoup.org/cookbook/extracting-data/selector-syntax

一般來說,你應該看看到Jsoup Codebook

您是否需要登錄或才能以訪客身份訪問論壇?

+0

未登錄。我必須在Java程序中使用Jsoup從論壇中提取僅用戶視圖 – Murali

+0

然後,您可以像這樣獲取完整的HTML文檔:'Document doc = Jsoup.connect(「http://yoururl.com/」).get( );' – ollo

+0

順便說一句。您可以使用此代碼:http://stackoverflow.com/questions/13005872/extract-the-thread-head-and-thread-reply-from-a-forum/13014174#comment17678171_13014174 – ollo