0
這是的情況:是否可以在上傳的pdf或Google文檔中搜索關鍵字?
我有我的驅動器文檔列表中的PDF和谷歌文檔。我想要構建一個接口,可以搜索這些文檔中的關鍵字並返回文檔名稱以及與搜索參數匹配的文本的可能預覽。這是可能的嗎?
問候,
肖恩
這是的情況:是否可以在上傳的pdf或Google文檔中搜索關鍵字?
我有我的驅動器文檔列表中的PDF和谷歌文檔。我想要構建一個接口,可以搜索這些文檔中的關鍵字並返回文檔名稱以及與搜索參數匹配的文本的可能預覽。這是可能的嗎?
問候,
肖恩
從谷歌文檔獲取文本很簡單:
// Get text from GDOC
var gdocDoc = DocumentApp.openById(gdocFile.id);
var text = gdocDoc.getBody().getText();
從Get pdf-attachments from Gmail as text的pdfToText()工具採用先進的驅動器服務和DocumentApp將PDF轉換爲谷歌 - 文本到文本。您可以通過這種方式獲取OCR文本,或者直接將其保存到驅動器上任何文件夾中的txt文件中。
// Start with a Blob object
var blob = DriveApp.getFilesByName("my.pdf")[0];
// filetext will contain text from pdf file, no residual files are saved:
var filetext = pdfToText(blob, {keepTextfile: false});
一旦你有了文字,搜索關鍵字就變得簡單了!
if (filetext.indexOf(keyword) !== -1) {
// Found keyword...
}
答案肯定是肯定的......文檔類包含你需要的工具,但是我不確定你會找到一個「現成的」應用程序來做它,也不會有人會寫代碼你......你嘗試過什麼嗎? –
你好,謝謝你的迴應。當然,我不希望有人爲我寫代碼。我發現準備好的東西真的不適合我要找的東西。我看了一下Document類文檔。不幸的是,我經常發現Google的文檔不清楚,缺乏示例。當然不是全部,但很多似乎不完整。我只是想確保這種可能性存在,然後才花時間討論最終可能無法實現的想法。 – user1682683