0
我嘗試將Html頁面轉換爲ecs對象。爲此,我使用partweise XPath。 (我使用Java編碼) 唯一的問題是,我希望XPath以String形式返回所有節點名稱和文本。這是一個有點難以解釋的話,下面有一個例子:使用XPath返回節點名稱和文本爲STring
的HTML文檔:
<html>
<head>
<title>Derp</title>
</head>
<body>
<div>nonsense<IOText></div>
<a href="http://google.de/">It's Google!</a>
</body>
現在我想執行以下XPath:
/html
而想要結果如下所示:
<head>
<title>Derp</title>
</head>
<body>
<div>nonsense<IOText></div>
<a href="http://google.de/">It's Google!</a>
</body>
有沒有這樣的功能?
到目前爲止,我只是尋找一個解決方案......但我找不到一個或想到一個:/我嘗試了一些函數,如文本()(返回null,什麼是合理的)和一些其他XPath函數,whioch只是拋出錯誤,因爲Java不知道它們(name()或local-name()) – notepass
所以你只是想刪除''? –
不,我希望使用XPath請求的標籤內的文本。另一個例子:如果我執行/ html/head,它應該返回