solr-cell

    0熱度

    1回答

    如何維護Solr給出的 結果中HTML文檔的原始格式? 我試圖在我的公司網站之一提供搜索功能,它有數百萬的文檔,並且都沒有類似的格式,所以很難單獨格式化每個文檔。 我在apache站點使用Solr 4.1 nightly builds,這個站點內置了對solr-cell和tika的支持。即我不需要單獨配置它們。 solr-cell或tika是否保留了這些格式? 如果不保留其格式,然後我需要每個文件

    0熱度

    1回答

    我試圖用post.jar來索引一個帶有pdf文件的文件夾。我已添加請求處理程序,但在啓動時出現錯誤。 看起來,它可能是一個版本衝突或重複的類加載,因此不被識別爲SolrRequestHandler。只是一個想法。 我使用iis在windows 2008 r2服務器上運行solr 3.4。 CONFIG: <lib dir="C:\ColdFusion10\cfusion\jetty\solr\co

    0熱度

    1回答

    當我在solr搜索引擎的查詢框中寫入一些查詢並詢問結果時,它顯示發現了一些文檔(numFound),但它每頁只顯示十個文檔。如何看到進一步的文件。沒有像「下一頁」或其他東西的鏈接。 請告訴我如何看後前十documen文件

    3熱度

    2回答

    我發現了一些與此問題相關的解決方案。正如我將解釋的,相關的解決方案對我來說不起作用。 (我正在使用Solr 4.0並將索引數據存儲在Oracle 11g數據庫中。) Jonck van der Kogel的相關解決方案(從2009年開始)解釋爲here。他介紹了創建一個自定義Transformer,有點像Solr附帶的ClobTransformer。這是優雅的道路,但沒有使用現在與Solr集成的T

    1熱度

    1回答

    我剛安裝了Solr6.6.0。在CentOS上,並使用提供的示例「sample_techproducts_configs」進行工作。我能夠索引文件,但只要我給它一個圖像文件,我就會收到關於無效日期的異常。 Solr細胞從EXIF中提取一個日期,然後似乎無法將其傳遞給Solr。 我用下面的圖像文件: http://www.imagemagick.org/Usage/photos/pagoda_sm.

    0熱度

    5回答

    我正在使用solr搜索引擎來進行文檔回覆中的項目目的。我的數據集是.txt文件格式。但是solr只給出了json,xml,pdf和其他一些文件格式的選項。沒有文本文件的選項。 對於使用.txt文件作爲數據集,我需要對solr進行一些修改嗎?

    0熱度

    1回答

    有沒有辦法通過配置使用Tika的spring-data-solr?否則,對於spring-data-solr,solrj的ContentStreamUpdateRequest+addfile有沒有其他選擇? 目前我以這種方式使用Solrj +提卡: SolrServer server = new HttpSolrServer(URL); ... Tika tika = new Tika();

    0熱度

    1回答

    我目前使用Solr-Cell來獲取多個html頁面的內容併爲它們編制索引。問題是我在所有頁面上顯示的標題中都有一個菜單。此菜單及其所有項目均顯示在搜索結果中。我不希望這被索引。 你會怎麼做到這一點? 是否可以排除某些DIV(帶有類名或ID)?

    0熱度

    1回答

    所以我試圖在Solr 5.4.1上使用Solr CEL和Tika索引文檔。我使用的是默認的配置,但是當我輸入我的文檔,我得到這個錯誤: multiple values encountered for non multiValued field meta: 下面是相關的錯誤日誌,你可以看到,我提供到Solr的數據。 125973 INFO (qtp840863278-17) [ x:fusear

    0熱度

    1回答

    我是Solr新手,我通過存儲在我的數據庫中的URL從二進制文件中提取元數據。我想知道哪些字段可用於從PDF索引(將以column =「」啓動的字段)。我也想知道如何在Solr中創建自定義字段。這是如何實現並映射到來自文件的特定元數據的。如果有人有一個代碼片段,可以告訴我,將不勝感激。 預先感謝您。