2013-03-03 80 views
0

我有內容的文件:如何從文件中讀取html?

<!DOCTYPE html> 
<html>  
     <head>  
      <title>Hello, w3c validator!</title>  
     <head> 
     <body>  
      <p>Hello again!</p>  
     </body> 
</html> 

如何閱讀在Java中該文件併發送到驗證,W3C?

+0

你的問題不是很清楚了嗎?您想做什麼? – 2013-03-03 13:17:19

+0

@Kata我認爲他需要在JAva中做一個小程序,作爲輸入獲取HTML文件,並隨着輸出提供文件上的w3c驗證輸出...我是否願意Relrin?你到目前爲止嘗試過什麼嗎? – araknoid 2013-03-03 13:25:43

+0

@araknoid absolutly – Relrin 2013-03-03 13:36:12

回答

1

你所尋找的是一個Java程序是:

  1. 輸入:HTML文件
  2. 閱讀HTML文件
  3. 驗證文件(W3C驗證)
  4. OUTPUT:驗證輸出

對於第1點和第2點,你可以給戰俘中的另一個帖子一個戰利品:Reading entire html file to String?

對於點3,你可以檢查Markup Validator Web Service API對於如何與W3C的HTML驗證的規範,但是這是他們在說什麼:

Note: Please be considerate in using this shared, free resource. 
Consider Installing your own instance of the validator for smooth and fast operation. 
Excessive use of the W3C Validation Service will be blocked. 

所以我的建議是閱讀這篇文章,以更好地理解你可以做什麼,如果你能在Java Programa它裏面集成:

Installation information for the W3C Markup Validator

+0

我正在嘗試使用rexsl-w3c,它將數據發送到此站點。如果獲取有關我的頁面無效的信息 - 打印錯誤,但總是在控制檯應用程序中獲得「0 0」,並且我不知道爲什麼... – Relrin 2013-03-03 14:13:55