1

搜索我有列Azure的SQL服務器(ID,名稱,所有者,資產)在桌子上[Assets]。 [Asset]列是用於存儲PDF文件的varbinaryblob類型。Azure中的SQL Server BLOB列

我想用Azure的搜索才能通過這個專欄的內容進行搜索。目前,Azure Search可以直接與Blob Store一起使用,也可以專門用於桌面存儲,但是我無法爲自己的場景找到解決方案,任何有關方法的幫助都非常感謝。

+0

這似乎很有幫助:https://docs.microsoft.com/en-us/azure/search/search-howto-connecting-azure-sql-database-to-azure-search-using-indexers – TheGameiswar

+0

有趣!您是否考慮過將文檔上傳到Azure Search?這會對您當前的設計產生一些影響,但可能更容易處理。 –

回答

0

Azure的搜索索引SQL不支持從VARBINARY/BLOB列文件提取。

一種方法是將上傳的文件數據到Azure的Blob存儲,然後使用Azure Search blob indexer

另一種方法是使用Apache提卡或iTextSharp的從代碼中的PDF,然後用Azure的搜索索引它提取文本。

+0

爲了擴展Eugene的說法,您可以嘗試的一個選擇是使用Azure函數。有一個如何在[Azure函數]中使用Tika進行PDF解析的例子(https://github.com/liamca/AzureSearch-AzureFunctions-CognitiveServices/tree/master/ApacheTika)。在這個例子中,它從Blob存儲獲取PDF,但是您可以切換它以從SQL中獲取它。 –

+0

謝謝尤金,利亞姆迴應。 –

+0

謝謝@Eugene Shvets - MSFT,利亞姆迴應。您能否讓我知道如果以下方法正常,我將繼續使用Azure Blob存儲,並利用元數據字段在SharePoint上列出字段。 Azure搜索可以搜索元數據和內容,從而解決我的問題。這種方法有什麼缺點嗎? –

1

是否可以創建SQL虛擬機,使用SQL數據同步將SQL Azure上的數據與虛擬機同步,然後將SQL虛擬機上的數據與Azure搜索同步,如解釋here

另一種選擇是你的SQL Azure數據庫遷移到SQL VM在Azure上,然後同步在SQL VM與Azure的搜索數據解釋here

希望這會有所幫助。

+0

這個答案似乎並沒有真正回答這個問題。 –

+0

同意@Eugene Shvets - MSFT。答案提供的是一種通用的搜索方法,我一直在尋找替代方法來搜索原始類型和varbinary字段的列數據。 –