solr-cell

0熱度

1回答

如何維護Solr給出的結果中HTML文檔的原始格式？我試圖在我的公司網站之一提供搜索功能，它有數百萬的文檔，並且都沒有類似的格式，所以很難單獨格式化每個文檔。我在apache站點使用Solr 4.1 nightly builds，這個站點內置了對solr-cell和tika的支持。即我不需要單獨配置它們。 solr-cell或tika是否保留了這些格式？如果不保留其格式，然後我需要每個文件

0熱度

1回答

solr extractrequesthandler不是org.apache.solr.request.SolrRequestHandler

我試圖用post.jar來索引一個帶有pdf文件的文件夾。我已添加請求處理程序，但在啓動時出現錯誤。看起來，它可能是一個版本衝突或重複的類加載，因此不被識別爲SolrRequestHandler。只是一個想法。我使用iis在windows 2008 r2服務器上運行solr 3.4。 CONFIG： <lib dir="C:\ColdFusion10\cfusion\jetty\solr\co

0熱度

1回答

Solr搜索引擎的結果

當我在solr搜索引擎的查詢框中寫入一些查詢並詢問結果時，它顯示發現了一些文檔（numFound），但它每頁只顯示十個文檔。如何看到進一步的文件。沒有像「下一頁」或其他東西的鏈接。請告訴我如何看後前十documen文件

3熱度

2回答

如何使用Solr 4.0+對包含爲數據庫BLOB的富文件格式的文檔進行索引？

我發現了一些與此問題相關的解決方案。正如我將解釋的，相關的解決方案對我來說不起作用。（我正在使用Solr 4.0並將索引數據存儲在Oracle 11g數據庫中。） Jonck van der Kogel的相關解決方案（從2009年開始）解釋爲here。他介紹了創建一個自定義Transformer，有點像Solr附帶的ClobTransformer。這是優雅的道路，但沒有使用現在與Solr集成的T

1熱度

1回答

Solr Cell無法用EXIF索引圖像文件

我剛安裝了Solr6.6.0。在CentOS上，並使用提供的示例「sample_techproducts_configs」進行工作。我能夠索引文件，但只要我給它一個圖像文件，我就會收到關於無效日期的異常。 Solr細胞從EXIF中提取一個日期，然後似乎無法將其傳遞給Solr。我用下面的圖像文件： http://www.imagemagick.org/Usage/photos/pagoda_sm.

0熱度

5回答

我們可以搜索Solr搜索引擎中的.txt文件嗎？

我正在使用solr搜索引擎來進行文檔回覆中的項目目的。我的數據集是.txt文件格式。但是solr只給出了json，xml，pdf和其他一些文件格式的選項。沒有文本文件的選項。對於使用.txt文件作爲數據集，我需要對solr進行一些修改嗎？

0熱度

1回答

有沒有辦法將Tik的spring-data-solr整合起來？

有沒有辦法通過配置使用Tika的spring-data-solr？否則，對於spring-data-solr，solrj的ContentStreamUpdateRequest+addfile有沒有其他選擇？目前我以這種方式使用Solrj +提卡： SolrServer server = new HttpSolrServer(URL); ... Tika tika = new Tika();

0熱度

1回答

Solr：排除某些HTML標記或僅包含索引內的某些標記

我目前使用Solr-Cell來獲取多個html頁面的內容併爲它們編制索引。問題是我在所有頁面上顯示的標題中都有一個菜單。此菜單及其所有項目均顯示在搜索結果中。我不希望這被索引。你會怎麼做到這一點？是否可以排除某些DIV（帶有類名或ID）？

0熱度

1回答

導入solr單元格/ Tika元數據導致文件導致多值錯誤

所以我試圖在Solr 5.4.1上使用Solr CEL和Tika索引文檔。我使用的是默認的配置，但是當我輸入我的文檔，我得到這個錯誤： multiple values encountered for non multiValued field meta: 下面是相關的錯誤日誌，你可以看到，我提供到Solr的數據。 125973 INFO (qtp840863278-17) [ x:fusear

0熱度

1回答

Solr元數據索引

我是Solr新手，我通過存儲在我的數據庫中的URL從二進制文件中提取元數據。我想知道哪些字段可用於從PDF索引（將以column =「」啓動的字段）。我也想知道如何在Solr中創建自定義字段。這是如何實現並映射到來自文件的特定元數據的。如果有人有一個代碼片段，可以告訴我，將不勝感激。預先感謝您。