搜索我有列Azure的SQL服務器(ID,名稱,所有者,資產)在桌子上[Assets]
。 [Asset]列是用於存儲PDF文件的varbinaryblob類型。Azure中的SQL Server BLOB列
我想用Azure的搜索才能通過這個專欄的內容進行搜索。目前,Azure Search可以直接與Blob Store一起使用,也可以專門用於桌面存儲,但是我無法爲自己的場景找到解決方案,任何有關方法的幫助都非常感謝。
搜索我有列Azure的SQL服務器(ID,名稱,所有者,資產)在桌子上[Assets]
。 [Asset]列是用於存儲PDF文件的varbinaryblob類型。Azure中的SQL Server BLOB列
我想用Azure的搜索才能通過這個專欄的內容進行搜索。目前,Azure Search可以直接與Blob Store一起使用,也可以專門用於桌面存儲,但是我無法爲自己的場景找到解決方案,任何有關方法的幫助都非常感謝。
Azure的搜索索引SQL不支持從VARBINARY/BLOB列文件提取。
一種方法是將上傳的文件數據到Azure的Blob存儲,然後使用Azure Search blob indexer。
另一種方法是使用Apache提卡或iTextSharp的從代碼中的PDF,然後用Azure的搜索索引它提取文本。
爲了擴展Eugene的說法,您可以嘗試的一個選擇是使用Azure函數。有一個如何在[Azure函數]中使用Tika進行PDF解析的例子(https://github.com/liamca/AzureSearch-AzureFunctions-CognitiveServices/tree/master/ApacheTika)。在這個例子中,它從Blob存儲獲取PDF,但是您可以切換它以從SQL中獲取它。 –
謝謝尤金,利亞姆迴應。 –
謝謝@Eugene Shvets - MSFT,利亞姆迴應。您能否讓我知道如果以下方法正常,我將繼續使用Azure Blob存儲,並利用元數據字段在SharePoint上列出字段。 Azure搜索可以搜索元數據和內容,從而解決我的問題。這種方法有什麼缺點嗎? –
這似乎很有幫助:https://docs.microsoft.com/en-us/azure/search/search-howto-connecting-azure-sql-database-to-azure-search-using-indexers – TheGameiswar
有趣!您是否考慮過將文檔上傳到Azure Search?這會對您當前的設計產生一些影響,但可能更容易處理。 –