如果默認情況下它的索引正確,則如果在模式中正確聲明瞭pdf內容,則將其索引到字段名稱content
中。因此請使用該內容字段搜索一些關鍵字(或*)。
例: q=content:keyword
(關鍵字 - >其存在於PDF)
http://localhost:8983/solr/gettingstarted/select?q=content:*
如果contetnt
字段是未定義的。然後在模式文件中添加字段定義。
例:字段名稱聲明
<field name="content" type="text_general" indexed="true" stored="true" multiValued="true"/>
字段類型確定指標
<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
我索引PDF這樣 '斌/後-c gettingstarted /家庭/ Ubuntu的/ pdf.pdf' ' http:// localhost:8983/solr/gettingstarted/select?q = content'顯示與'q = *。pdf'相同的結果。 'http:// localhost:8983/solr/gettingstarted/select?q = content:*'給出404錯誤。 請任何建議。 –
這可能表示您沒有內容字段。用'*:*'搜索並應用必要的'fq'來查找你的文檔。 –
你得到了什麼錯誤。?正如我前面提到的那樣,@BinoyDalal說'內容'字段可能沒有在模式文件中定義。檢查一下。我想你沒有正確的索引pdf。 – vinod