摘要: 如何編寫正則表達式的谷歌應用程序腳本,將fwtch的所有鏈接錨從HTML谷歌企業應用套件+ HTML +正則表達式獲取所有鏈接錨
我的任務: 我GoogleSpreadsheet與網址,其中鏈接到我的網站是(網站管理員 - >鏈接到我 - >出口)。 我需要錨履帶(使用谷歌應用程序腳本)來查看垃圾鏈接垃圾郵件。
實現(我能做些什麼):
function doGetLinks(url, link, encoding)
{
var encoding = "windows-1251";
Utilities.sleep(1000);
var page = UrlFetchApp.fetch(url).getContentText(encoding);
var matched = page.match(/<a\s+(?:[^>]*?\s+)?href\s*=\s*(\"([^"]*\")|'[^']*'|([^'">\s]+)).*<\/a>/gim);
var amt = "$0";
if (matched != null)
{
for (var i in matched)
{
var anchor = matched[i];
amt = anchor + " | ";
}
}
return amt;
}
怎麼看呢:
- 寫任何單元格公式= doGetLinks( 「http://4uarticles.net/15295/insulating-oil-reconditioning/」, 「articlesynergy.com」)
問題(我不能):
- 如何編寫正則表達式爲以只返回
- 如何迫使它返回所有符合要求的鏈接(現在只有先返回,althoug用於關鍵 /g)的錨
- 如何inbuild在正則表達式變量的「鏈接」 - 它沒有 報價來做到這一點。但我只需要查看僅鏈接到我的網站的鏈接
你可以看到樣品https://docs.google.com/spreadsheet/ccc?key=0Ap5D58-gT2y7dC1IN1JtTUpzcG5PeElvQnM3SzFWUHc&usp=docslist_api#gid=0 – GlobeCore