2012-06-29 17 views
-1

我一直在嘗試使用XPath從網站中提取電子郵件地址。整個頁面上只有1個電子郵件地址。有沒有簡單的方法來使用XPath引用這個電子郵件地址?使用XPath在頁面上獲取唯一的電子郵件地址

類似://a/contains(@href,'@')

我試圖相似,我已張貼上面沒有成功的東西,我想在一個可靠的方式使用XPath拉的e-mail地址感謝任何建議。假設頁面上只有1個電子郵件地址,除了簡單的<a href="mailto:[email protected]">標籤外,沒有識別信息。

謝謝

+0

沒有太多的數據可以繼續。你確定該網站是有效的XML,否則沒有太多的XPath做... –

+0

@Jan Doggen,我沒有故意包含特定的網站,因爲使XPath只爲一個特定的網站工作,是沒有使用我,我試圖尋找一個統一的解決方案,假設XML是有效的,獲得第一個電子郵件地址找到。 – AnchovyLegend

回答

1
//a[contains(text(), "@")] 

這將返回包含電子郵件地址的節點(嗯,至少@標誌),而不是電子郵件地址本身。

如果你可以肯定的節點中包含電子郵件地址,並沒有其他相鄰的文本,你可以用得到它

//a[contains(text(), "@")]/text() 

如果不能可以肯定,你」 d必須手動將它從字符串中進行字符串處理。這在XPath 1.0中會非常痛苦,因爲根據您的實現,您可能無法訪問任何REGEX功能。 「來自網站」的

+1

我不明白你的問題。你給的鏈接說我需要登錄,它的源代碼不包含任何電子郵件地址。 – Utkanos

+0

Yeap,我給你的XPath會做到這一點。請參閱此[XML Playground](http://www.xmlplayground.com/u6226D)以獲取證明。 – Utkanos

+1

我不知道Google Docs API,但從純粹的XPath角度來看,我給出的路徑滿足您的要求,如操場會議中所示。你確定頁面的源代碼是格式良好的XML,即它可以遍歷嗎?您可能需要重新標記問題以納入Google文檔,以便該領域的人員可以提供幫助。 – Utkanos

相關問題