2012-08-07 38 views
1

我使用xdmp:document-filter(doc())從文檔(doc,docx,pdf等)提取元數據。我們正在使用它,因爲它適用於各種文檔格式,併爲每種文檔生成格式。但是這個命令的主要缺點是它減慢了查詢速度。如果數據庫中有一個或兩個文檔,則查詢可以正常工作,但如果有更多文檔(例如10或15),則查詢速度會變慢。我們想要從數據庫中所有文檔的元數據中提取和顯示信息。如何提高Marklogic中的xdmp:document-filter()性能?

,我們正在使用這個查詢: -

for $d in fn:doc() 
return xdmp:document-filter(doc(fn:base-uri($d))) 

有沒有什麼辦法讓這個查詢工作更快或有任何替代xdmp:document-filter()

回答

2

xdmp:document-filter()通常在ETL時間使用。如果您使用Information Studio加載內容,則可以添加「篩選文檔」轉換。您可以選擇將提取的元數據作爲單獨的xhtml文檔存儲,還可以選擇爲文檔屬性。這樣,他們不需要在每次請求時即時計算。

HTH!