2016-04-28 119 views
0

我想將ommitNorm=true添加到標題字段。Dspace和SOLR配置

這是錯誤地overboosting我們的一些標題。

但是我不知道標題字段是如何索引的。它的名字是什麼 - 只是dc.title?

因爲在schema.xml中,我沒有看到任何關於它的信息。什麼是該領域的類型,什麼分析器或其他什麼東西用於它。無論如何知道嗎?

回答

1

DSpace中的大多數元數據字段都是通過動態字段處理的。這就是爲什麼你沒有在搜索核心的schema.xml文件中看到每個單獨指定的原因。

我不確定提升發生的位置(或者DSpace是否執行任何操作)。我不記得在查看solr日誌文件時看到任何boost子句。我看到一些提取參數在SolrServiceImpl#writeDocument中設置,文檔正在索引。它看起來像是一個提取單個字段的提取參數,也許你可以用它來獲得你想要的。

如果你想看到的任何Solr的字段的字段類型,最簡單的選擇可能是在Solr管理用戶界面架構瀏覽器,如 http://localhost:8080/solr/#/search/schema-browser?field=title(您可能需要使用SSH隧道或類似訪問的Solr運行在不同的主機上,因爲DSpace solr安裝通常是IP限制的,以便從本地主機訪問)。

+0

謝謝你的回答。我會看一下。然而,同樣我不認爲這是一個提升,我在想的是自然場的正常化。我想爲標題做一些特殊的處理,並刪除字段標準化的選項。雖然我無法弄清標題的動態字段(規則)。 – MaatDeamon

+0

如果你想出來,一定要發佈你自己的答案這個問題 - 我敢肯定還有其他的DSpace用戶會對此感興趣。您也可以在dspace-tech郵件列表上詢問,也許其他人已經找到了解決方案。 – schweerelos