2015-12-21 47 views
0

我有一個超過10.000個網站的列表,我想在所有這些網站中搜索關鍵字。使用import.io在不同結構的多個網站中搜索單詞

預期結果應該類似於鏈接,如果網站包含關鍵字,則值爲1的列,如果不包含則爲0。

有什麼辦法可以指定一個網站列表和一個關鍵字來搜索使用import.io?

回答

0

當您爬網的每個站點都具有相似的結構時,導入io會發揮最佳效果。如果你正在使用進口IO設置,

1)把所有的網站鏈接到一列

2)使用「提取」類型API的「批量提取」選項退出所有文本從每個頁面放入一個列。

3)打開導出Excel或谷歌電子表格,並使用「查找」功能,看看你的關鍵字包含在每個細胞

雖這麼說,我想你可以使用不同的網絡有更好的運氣因爲你實際上並不想要提取內容,所以需要抓取服務。