2011-08-12 37 views
1

我對iMacro腳本世界很陌生,因此我很難獲得(我相信是)一個非常簡單的數據刮擦工作。簡單的iMacros循環和提取

我希望抓取的網站包含一個索引頁面(每個新行都是產品頁面的超鏈接),然後是產品頁面(每次都有相同的格式)。我想宏觀做到以下幾點....

  1. 單擊第一個超鏈接(錶行即POS1
  2. 一旦加載頁面,颳去10場(總是會在每個相同的地方頁)
  3. 轉到BACK(索引頁)
  4. 遞增到下一個超鏈接(表格下一行即POS2
  5. 中提取數據,並重復
  6. 將數據導出爲一個單一的文件/ C SV每組刮數據是一個新行/列

這是我迄今爲止...(鏈接刪除,因爲它需要登錄)

VERSION BUILD=7401598 
TAB T=1 
TAB CLOSEALLOTHERS 
URL GOTO=https://XXXXXXXXXXXX 
TAG POS={{!loop}} TYPE=TD FORM=ID:form1 ATTR=TXT:* 
TAG POS=8 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=6 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=20 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=24 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=22 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=34 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=38 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=42 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=46 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT 
TAG POS=66 TYPE=TD FORM=ID:form1 ATTR=CLASS:labelBold EXTRACT=TXT 
SAVEAS TYPE=EXTRACT FOLDER=C:\iMacrosExports\ FILE=Extract_{{!NOW:ddmmyy_hhnnss}}.csv 
WAIT SECONDS=2 
BACK 

上面的腳本只有從第一個產品頁面收集數據,並將其導出爲多個CSV(但我多次聲明它爲循環)。

任何幫助將非常感激。如果您需要更多信息,請讓我知道。

+0

我相信'{{!LOOP}}'[應該大寫(http://wiki.imacros.net/ !LOOP#See_Also)。 –

回答

1

您的宏看起來沒問題。我只會在最後刪除BACK命令,因爲你有在每個循環回到索引頁面的URL GOTO。只要你使用「播放(循環)」按鈕,它應該工作...

宏是否工作,如果你手動增加POS的價值?我的意思是,你首先運行POS = 1(而不是{{!loop}},然後再用POS = com或張貼在iMacros forum你的問題。

問候,

瑪西婭