如何從html頁面中提取文本?例如,網頁是我想要取文本的鏈接http://www.atempodihockey.it/campionati/campionati-hil/serie-a1-2013-2014/calendario.html。我必須有球隊的名字,比賽如何從html頁面提取文本?
回答
爲了這個目的的resoult,您可以使用HtmlAgilityPack
做得一樣follwing ...
在項目中加入HtmlAgilityPack的參考。
using HtmlAgilityPack;
,然後把網址以獲得完整的頁面
HtmlWeb webGet = new HtmlWeb();
HtmlDocument document = webGet.Load("http://www.atempodihockey.it/campionati/campionati-hil/serie-a1-2013-2014/calendario.html");
從「文件」變量,你可以得到你預期的文本的HTML
當我複製你寫的文本時,我有var和HtmlWeb的問題(HtmlWeb是類?) –
您是否添加了對HtmlAgilityPack的引用? – gypsyCoder
是的但是正常,我有HtmlWeb e var的問題? –
我想下面的代碼可以幫助ü
webView = (WebView) findViewById(R.id.webterms);
webView.getSettings().setJavaScriptEnabled(true);
webView.getSettings().setPluginsEnabled(true);
webView.getSettings()
.setUserAgentString(
"Mozilla/5.0 (Linux; U; Android 2.0; en-us; Droid Build/ESD20) AppleWebKit/530.17 (KHTML, like Gecko) Version/4.0 Mobile Safari/530.17");
創建webview後加載你的url或html頁面
webView.addJavascriptInterface(new MyJavaScriptInterface(),"HTMLOUT");
webView.setWebViewClient(new WebViewClient() {
@Override
public boolean shouldOverrideUrlLoading(WebView view, String url) {
view.loadUrl(url);
return false;
}
@Override
public void onPageFinished(WebView view, String url1) {
if (pDialog.isShowing()) {
pDialog.dismiss();
}
webView.loadUrl("javascript:window.HTMLOUT.processHTML(document.documentElement.innerText);");
}
});
webView.loadUrl(url);
然後創造出具有處理您的HTML
class MyJavaScriptInterface {
public void processHTML(String html) {
if (null != html && html.trim().length() > 0) {
System.out.println("your Html ->" + html);
}
}
你能告訴我只有一個頁面的程序,因爲我有一些問題要複製三個不同的部分到我的程序中。感謝 –
從我發現你必須在processHtml函數聲明之前放置'@ JavascriptInterface' – ccwasden
- 1. 如何從html頁面提取文本?
- 2. 如何從HTML頁面中提取文本塊?
- 3. 如何從C#中的HTML頁面中提取此文本?
- 4. 如何從HTML頁面提取鏈接?
- 5. 從html頁面獲取文本shell
- 6. 如何從HTML源文件中提取頁面上可見的文本?
- 7. 如何提取從HTML標記文本
- 8. 如何從HTML頁面文件中提取日期和時間?
- 9. PHP從html頁面提取所有文本
- 10. Java庫從HTML頁面中提取文本塊
- 11. 如何從Perl中的HTML頁面上的鏈接中提取文本?
- 12. 從HTML中提取文本
- 13. 從html中提取文本?
- 14. 從HTML中提取文本
- 15. 通過從其他HTML頁面提取的DIV生成HTML頁面的腳本
- 16. jQuery:如何從頁面獲取文本?
- 17. 如何從PDF頁面獲取文本?
- 18. 如何使用jsoup從此html頁面獲取文本?
- 19. 如何從pdf頁面使用Zend_Pdf提取文本
- 20. 只從html頁面提取單詞
- 21. 從HTML頁面提取csv數據
- 22. sed從html頁面提取鏈接
- 23. 從html頁面提取classes/id
- 24. 從html頁面提取類內容
- 25. 從HTML頁面提取段落
- 26. 使用php從html頁面提取href
- 27. 從HTML頁面提取數據(Python)
- 28. 從html頁面提取內容
- 29. 如何從網頁獲取文本到我們的本地html頁面?
- 30. 從HTML文本提取標題文本
你想提取整個HTML頁面的文本一個方法的類? –
使用'HtmlAgilityPack'獲取html頁面 – gypsyCoder
但是我有HtmlAgilityPack的問題 –