2015-05-01 17 views
1

我最近閱讀了這個article關於如何使用Excel刮掉Inbound.org社區成員配置文件。如果您喜歡這種方式,您可以在這裏觀看video從在線社區中刪除XPath數據

自從本教程發佈以來,入站網站結構發生了一些變化,正如您可以在視頻中的分鐘11點所看到的那樣,如果您嘗試複製社交媒體圖標的XPath,它會顯得稍有不同,因此,我無法提取這些信息。

這是我現在得到:

/html/body/div[3]/div/div/div[1]/div/div[2]/a[1]/i 

這是我寫在Excel中的語法:

=XPathOnUrl(A2,"//a[@class='twitter']","href") 

然後是這樣的:

=XPathOnUrl(A2,"//a[contains(@class,twitter)]/@href") 

雖然我試過許多不同的方式,他們都沒有向我展示與會員的社交媒體個人資料的鏈接。

我甚至試圖改變以多種方式從頁面獲取不同的數據的XPath,但它沒有一個是社交媒體信息:

=XPathOnUrl(A2,"//*[contains(@class,member-banner-tagline)]/div[2]/div/div/div[1]/div/div[1]") 

=XPathOnUrl(A2,"//*[contains(@class,member-banner-tagline)]/div[2]/div/div/div[1]/div/h1") 

老實說,我不知道該怎麼再嘗試了,有什麼地方錯了,我無法弄清楚。任何人都有足夠的經驗,或者可以用我的語法來查明問題?

非常感謝

回答

1

您嘗試的第一個公式看起來不錯,但是這是對我的作品的一個(SEO工具版本4.3.4):我想你的公式

=Dump(XPathOnUrl(A2;"//a[@class='twitter']";"href";HttpSettings(TRUE))) 
+0

和我來自Excel的一個錯誤說它發現了一個公式的問題,我不得不改變它。我也使用SEO工具版本4.3.4 –

+0

好的,我得到了正確的。這裏是:轉儲(XPathOnUrl(A2,「// */div [2]/div/div/div [1]/div/div [2]/a [1]」,「href」)) –