2010-09-07 51 views
0

我想要獲得人類可讀形式的網站的文本表示,例如超鏈接位置或輸入字段。
有沒有這樣的庫? (我檢查傑里科渲染器,但它並不顯示輸入字段)
例如將HTML網頁呈現爲Java中的文本

<div> 
<form action="example.php"> 
Name: 
<input type="text" name="name_field"> 
<input type="button" value="OK"> 
</form> 
</div> 

到這樣的事情

Name: [________] [OK] 
+0

HTML *是*網站的文本表示形式。請舉個例子。 – skaffman 2010-09-07 18:35:58

+0

好的,編輯這個問題來舉個例子。 – user 2010-09-07 18:49:25

回答

0

嘗試tag soup並建立它自己。你得到了一個HTML的DOM模型,並且可以吐出文本。