2011-12-05 24 views
0

我有一個鏈接到500維基百科/維基媒體維基,談話頁面和歷史頁面在一個Excel文檔中,我想解析以確定有多少Wiki提及「廣告」或「促銷」,Wiki的平均使用時間,編輯頻率如何等等。網站分析的高級Excel /視覺基礎

我已經想出瞭如何編寫將獲得完整HTML的Visual Basic用戶定義函數。是否有插件或其他方式讓文本顯示在屏幕上 - 兩個標籤或標識符之間,以便我可以提取我需要的信息?

與專業開發人員相比,我是一名業務專業人員,編碼經驗非常有限。但是,如果你能指出我正確的方向和一些好的教程,我可以學習。如果有人可以幫忙,我也會很感興趣,只需要向他人支付一點錢。

回答

0

您可以使用XML解析器和正則表達式來搜索HTML文檔中的文本。

要在瀏覽器中看到文本,請編寫一個函數以刪除所有標記。雖然,它可能並不總是準確的,因爲CSS和Javascript可以改變屏幕上可見的內容。