2016-08-02 177 views
0

我正在創建一個MarkLogic搜索,最終用戶可以搜索字符串並獲取pdf文檔結果。我創建了一個數據庫,並以適當的權限以PDF格式上傳文件。這裏的問題在於我的搜索沒有以PDF格式返回結果,而是以XML和XHTML格式返回。Marklogic PDF文檔搜索

有人可以請告知什麼可以在這裏做的搜索只返回PDF文檔?

+1

歡迎來到Stackoverflow!您能否詳細說明您的問題,比如代碼或其他事情,以便人們能夠儘早解決問題並幫助您?謝謝! – JRSofty

回答

1

在過去的項目中,我有PDF文件和該PDF的單獨XML文檔(包括要下載的PDF的URI)。我根據XML表示進行搜索並對結果進行格式化,以包含下載原始PDF的鏈接。根據PDF存儲的位置/方式,您可能需要採取一些措施來方便通過網址提供PDF。

+0

謝謝你的回答。你能否也請告知如何準備包含PDF的URI的XML文檔。有沒有預定義的命令?請指教。 – V3nky

+0

我不認爲有任何預定義。您可以使用命名約定來構建原始文檔的URI ...讓我試着說明... –

+0

您有一個名爲「foo.pdf」的pdf文件,它被攝入MarkLogic。不知何故,您已將其轉換爲xml或使用CPF在數據庫中創建XML文檔。 除了xml(可搜索)版本之外,您需要做的是將「foo.pdf」另存爲數據庫中的二進制文件。該XML文件可能包含二進制存儲位置的URI。這需要更改xml。或者爲二進制文件指定一個URI,如「/binary/foo.pdf」和xml「/xml/foo.xml」 這將允許你建立一個鏈接來替換「/ xml /」中的「/ binary /」結果uri指向下載二進制文件... –