我有一個客戶,主要有掃描合同和文件的PDF文件。 PDF已經被OCR和文本插入爲正文。我們遇到的問題是超過100MB的文檔正在創建轉換文本錯誤,並且沒有對GSA中的文本內容編制索引。如何在Google Search Appliance中爲大文件建立索引?
我們正在使用外部文件共享連接器來提供和抓取文檔。
我們如何增加超過100MB的最大文件大小和處理PDF文件?
我有一個客戶,主要有掃描合同和文件的PDF文件。 PDF已經被OCR和文本插入爲正文。我們遇到的問題是超過100MB的文檔正在創建轉換文本錯誤,並且沒有對GSA中的文本內容編制索引。如何在Google Search Appliance中爲大文件建立索引?
我們正在使用外部文件共享連接器來提供和抓取文檔。
我們如何增加超過100MB的最大文件大小和處理PDF文件?
根據documentation,您可以在管理控制檯的主機負載設置頁面上更改這些最大值。
請注意文本的量將在GSA內大文件被截斷。 https://support.google.com/gsa/answer/4411411?hl=en
解決方法有很多,在那裏,更換GSA和不截斷http://fortune.com/2016/05/27/google-search-appliance-gone/
HPE IDOL是其中之一。 http://go.saas.hpe.com/idol/gsa –