我有以下XML結構: -Marklogic:獨特單詞數
<Root>
<text>
Marklogic is a good big data tool. Right now I am exploring Marklogic.
</text>
</Root>
現在我想算的唯一字(如Marklogic- 2倍,BIG-1時,數據-1時間等的發生)。我通過使用fn:count()
來實現此目的,但在數據庫較大的情況下,fn:count()
太慢。
是否有任何其他優化的方式來實現這一目標? (與索引相關的東西)
http://stackoverflow.com/questions/25403223/counting-all-unique-words-in-an-unstructured-document-using-index-data –