使用XPath在頁面上獲取唯一的電子郵件地址

-1

我一直在嘗試使用XPath從網站中提取電子郵件地址。整個頁面上只有1個電子郵件地址。有沒有簡單的方法來使用XPath引用這個電子郵件地址？使用XPath在頁面上獲取唯一的電子郵件地址

類似：//a/contains(@href,'@')

我試圖相似，我已張貼上面沒有成功的東西，我想在一個可靠的方式使用XPath拉的e-mail地址感謝任何建議。假設頁面上只有1個電子郵件地址，除了簡單的<a href="mailto:[email protected]">標籤外，沒有識別信息。

謝謝

沒有太多的數據可以繼續。你確定該網站是有效的XML，否則沒有太多的XPath做... –

@Jan Doggen，我沒有故意包含特定的網站，因爲使XPath只爲一個特定的網站工作，是沒有使用我，我試圖尋找一個統一的解決方案，假設XML是有效的，獲得第一個電子郵件地址找到。 – AnchovyLegend

//a[contains(text(), "@")]

這將返回包含電子郵件地址的節點（嗯，至少@標誌），而不是電子郵件地址本身。

如果你可以肯定的節點中包含只電子郵件地址，並沒有其他相鄰的文本，你可以用得到它

//a[contains(text(), "@")]/text()

如果不能可以肯定，你」 d必須手動將它從字符串中進行字符串處理。這在XPath 1.0中會非常痛苦，因爲根據您的實現，您可能無法訪問任何REGEX功能。「來自網站」的

2012-06-29 19:18:55 Utkanos

我不明白你的問題。你給的鏈接說我需要登錄，它的源代碼不包含任何電子郵件地址。 – Utkanos

Yeap，我給你的XPath會做到這一點。請參閱此[XML Playground]（http://www.xmlplayground.com/u6226D）以獲取證明。 – Utkanos

我不知道Google Docs API，但從純粹的XPath角度來看，我給出的路徑滿足您的要求，如操場會議中所示。你確定頁面的源代碼是格式良好的XML，即它可以遍歷嗎？您可能需要重新標記問題以納入Google文檔，以便該領域的人員可以提供幫助。 – Utkanos

回答