我們希望索引並將一組Word文檔存儲在Solr中,並將它們顯示爲多值文本字段的元素,每個文檔的內容都顯示爲元素在索引中的那一個條目下。換句話說,它看起來像這樣Solr - 爲單個唯一ID存儲多個Word文檔
- ID
- ABCDEF [Word_1.docx的文本]
- XYZABC [Word_2.docx的文本]
- efghij [Word_3.docx的文本]
我們不希望每個索引的文檔都有自己唯一的ID;一組文件將是特定身份證件的子女。該ID可以有任意數量的文件。 如何做到這一點?
更新:這是我的C#代碼;我將如何讀取多個文件到這個爲(++count).ToString()
設置的唯一ID?
using (FileStream fileStream = File.OpenRead(path))
{
solr.Extract(
new ExtractParameters(fileStream, (++_count).ToString())
{
ExtractFormat = ExtractFormat.Text,
ExtractOnly = false,
Fields = new List<ExtractField>()
{
new ExtractField("action", actionTo),
new ExtractField("actiondate", actionDate),
new ExtractField("abstract", abstract),
new ExtractField("docval", docval),
new ExtractField("documentgeo",documentgeo),
new ExtractField("filename", filename),
new ExtractField("isprimary", IsPrimary.ToString())
},
AutoCommit = true
}
);
}
https://groups.google.com/d/topic/solrnet/DuHv0EGK_y4/discussion – 2012-08-14 22:58:03