2014-11-22 104 views
0

這是我的代碼。當輸出打印,也打印段落之間的白色空間。如何刪除段落之間的空白,然後我想在數組列表中逐句存儲。如何刪除Jsoup輸出段落中的段落之間的空格?

public static void main(String[] args) { 

    try { 
      String url = "http://www.divaina.com/"; 

      System.setProperty("http.proxyHost", "cache.mrt.ac.lk"); 
      System.setProperty("http.proxyPort", "3128"); 

      Document doc = Jsoup.connect(url).timeout(10000).get(); 

      Elements paragraphs = doc.select("p"); 
      for(Element p : paragraphs){ 
      System.out.println(p.text());} 
       } 
     catch (IOException ex) { 
      ex.printStackTrace(); 
      } 


} 

當我直接將內容添加到數據庫空白處也添加它。我怎樣才能刪除段落之間的空白處?其實我想讀網頁的內容並逐行添加到數據庫中。有沒有其他適當的方法來做到這一點?

Screen shot of out come

回答

1

顯然,有些段落不包含文本。這可能有所幫助:

for (Element p : paragraphs) 
{ 
    if (p.text().length() != 0) 
    System.out.println(p.text()); 
} 
+0

除了一些內容幾乎沒有問題。 Thanx很多博士。祝你今天愉快 :) – Maduri 2014-11-22 13:18:58

0

使用正則表達式:

String withoutspace = whitespace.replaceAll("\\s", ""); 

或者試試這個

String withoutSpace = whitespace.replace("\n", "").replace("\r", ""); 
+0

段落之間出現空格。一段打印。然後有時打印空間,然後再打印下一個paragrph。上面的代碼不適合我。 – Maduri 2014-11-22 10:01:06