我正在嘗試開始使用Apache Solr,但有些事情並不清楚。通過tutorial,我已經建立了一個正在運行的Solr實例。我感到困惑的是Solr的所有配置(模式等)都是XML格式。當他們添加示例數據時,它會顯示如何添加xml文檔(java -jar post.jar solr.xml monitor.xml
)。這只是樣本格式的錯誤選擇嗎?我的意思是,他們是上傳描述文檔的數據,還是他們添加的實際文檔是.xml文件?Solr入門
我試圖添加一些書籍的.txt格式,所以如果我使用java -jar post.jar mydoc.txt
,我添加它?我怎麼能添加這個文件和元數據(作者,標題)呢?
這麼說,我試圖建立一個簡單的HTML頁面,文檔發佈到Solr:
<html>
<head></head>
<body>
<form action="http://localhost:8983/solr/update?commit=true" enctype="multipart/form-data" method="post">
<input type="file">
<input type="submit" value="Send">
</form>
</body>
</html>
當我嘗試發佈一個文件,我得到這樣的迴應:
<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">26</int>
</lst>
</response>
是這正確嗎?這是否意味着我已經成功添加了我的文件?如果是這樣,文件中的一個單詞就是「montagna」(這是一本意大利書,montagna意味着山......)。如果我訪問的URL
http://localhost:8983/solr/select/?q=montagna&start=0&rows=10&indent=on
我想到的東西要返回(整個文本也許,或有關文件的一些信息),但是這是我得到:
<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">1</int>
<lst name="params">
<str name="indent">on</str>
<str name="start">0</str>
<str name="q">montagna</str>
<str name="rows">10</str>
</lst>
</lst>
<result name="response" numFound="0" start="0"/>
</response>
似乎並不像一場比賽給我。另外,根據to this answer,我應該能夠找回與hl.fragsize
相匹配的文字。我如何將它集成到搜索字符串中?謝謝