我想要做的是解析&從最終將保存到電子表格中的網頁中提取電影標題,但不包含所有HTML gunk。我的代碼:GoogleAppsScript:如何在解析HTML後修剪字符串?
function myFunction() {
var url = UrlFetchApp.fetch("http://boxofficemojo.com/movies/?id=clashofthetitans2.htm")
var doc = url.getContentText()
var patt1 = doc.match(/<font face\=\"Verdana\"\ssize\=\"6\"><b>.*?<\/b>/i);
//var cleaned = patt1.replace(/^<font face\=\"Verdana\" size\=\"6\"><b>/,"");
//Logger.log(cleaned); Didn't work, get "cannot find function in object" error.
//so tried making a function below:
String.trim = function() {
return this.replace(/^\W<font face\=\"Verdana\"\ssize\=\"6\"><b>/,""); }
Logger.log(patt1.trim());
}
我很新的這一切(編程和GoogleScripting一般),我一直在引用上有w3school.com的JavaScript部分,但很多事情就是不與谷歌腳本的工作。我只是不確定這裏缺少什麼,是我的RegEx錯誤嗎?有沒有更好/更快的方式來提取這些數據而不是RegEx?任何幫助將是偉大的,謝謝你的閱讀!
嘗試Xml服務https://developers.google.com/apps-script/service_xml – Srik