2014-01-24 74 views
0

我有一個很長的URL列表,我想從每個標題中額外添加標題並將其保存到Microsoft Excel文件中。從網頁列表中提取H1標題

我試過尋找代碼來做到這一點,但無法找到它。我使用Firefox的iMacros。

回答

0

我會建議在excel VBA本身中使用Internet Explorer對象以及MSHTML對象庫,這可能會使用第三方應用程序起飛。

+0

我確定使用iMacros可以非常輕鬆地完成此操作。不幸的是,我目前無法嘗試其他方法。 – user3216933

+0

提取元素的詳細信息涉及循環這是爲什麼我建議你選擇該方法。 –

+0

不太瞭解它,但是我之前使用過iMacros來完成類似的任務 – user3216933

0

您首先需要一個文件中的URL列表(每行一個URL)。我們稱之爲listOfUrls.csv(保存爲Excel或僅使用純文本文件)。您將該文件放入iMacros/Datasources文件夾中。

然後宏本身:

SET !DATASOURCE listOfUrls.csv 
SET !DATASOURCE_COLUMNS 1 
SET !LOOP 1 
SET !DATASOURCE_LINE {{!LOOP}} 
TAB T=1 
URL GOTO={{!COL1}} 
TAG POS=1 TYPE=TITLE ATTR=* EXTRACT=TXT 
SAVEAS TYPE=EXTRACT FOLDER=* FILE=openThisInExcel.csv 

現在你要玩宏作爲環(尋找「播放(循環)」)。播放次數與列表中的網址一樣多(在「Max:」中設置)。然後宏將帶你到每個URL並獲得標題,並將其保存到openThisInExcel.csv。而已。

您可能還想將URL保存在結果CSV中(這樣您就知道哪個標題對應哪個URL)。在最後一行或行之前添加以下內容(取決於您想要的列順序):

ADD !EXTRACT {{!URLCURRENT}}