inverted-index

    1熱度

    4回答

    全部,請原諒我剛開始學習如何使用SOLR。強大的SE。 而且我已經知道Inverted Index是SOLR中搜索速度如此之快的原因。在很多人看來。像Solr in action,Apache Solr search pattern。倒像索引如下所述和描述。 而且我也知道Document由Fields。 在我對上述數據結構的理解。當用像「哈利」這樣的特定術語進行搜索時。 SE將返回結果文件1,2。

    1熱度

    1回答

    我正在尋找步驟/庫/方法來解決這個問題陳述。 給定一個編程語言的源文件,我需要解析它並將其細分爲組件。 例如: 給定一個Java文件,我需要找到它。進口 列表 類存在於類 方法中它是 屬性 - 沿參數(如有)。 等 我需要提取這些並分別存儲它。 原因爲什麼我想要做它? 我想在這些組件的頂部建立一個倒置索引。 實施例的查詢來反向索引 1.找到與類名的文件的列表:樣品 2.查找其中變量XXX是AAA級

    0熱度

    1回答

    我在學校有一個項目,我需要使用倒排索引創建一個搜索引擎,並且我有點被阻止瞭如何繼續。 我使用倒排文件索引存儲了我的文檔中的所有單詞(4個文檔),但是通過某種方式,每個單詞在特定文件中都有一行,因此可以說文檔2中出現「like」三次和doc 4兩次 - 所以它會有2行,字:像docid:2命中:3 instoplist:0和word:像docid:4命中:2 instopelist:0(命中是這個詞

    0熱度

    1回答

    如果文檔被插入,刪除或更新,我如何更有效地更新倒排索引?我也應該使用索引文件來存儲索引,或者我應該將索引存儲在數據庫表中嗎?

    0熱度

    1回答

    據我所知,散列/倒排索引分別將值/字映射到記錄/文檔。 然而,散列索引中的插入複雜度較低(因爲它在溢出的情況下添加了一個新的存儲區),但倒數索引更多(由於保留了排序的文檔ID列表)。 這是否意味着它們本質上是相同的,除了實現?

    1熱度

    1回答

    我正在構建一個需要搜索引擎的Web應用程序,該搜索引擎將在靜態數據集上執行查詢。 我在本地存儲上有大約400,000個文本文件,我想根據它們構建一個倒排索引。然後,我需要在Web應用程序中使用此索引,用戶可以在該索引上執行查詢。 但是,我很困惑我是應該使用Solr平臺還是僅僅使用Lucene來構建索引並執行搜索。你能解釋一下哪個選項對我來說最合適嗎?

    3熱度

    2回答

    根據我的理解,elasticsearch使用稱爲倒排索引的結構來提供全文搜索。很顯然,倒排索引具有包含該術語的文檔的術語和ID,但文檔可以具有任意數量的字段,並且字段名稱可以用於查詢時間僅在該字段上查找/搜索。在這種情況下,elasticsearch如何將搜索限制在一個特定的領域?我想知道倒排索引是否包含字段名稱或字段ID以及術語和文檔ID。 當您根據任何字段進行排序時,會發生類似的情況。所以可能

    0熱度

    1回答

    我遇到了一個困惑了很久的問題。我想知道有沒有人可以解決這個問題。 我一直在寫一個倒排索引來支持文本檢索。我實現了兩種方式來支持用戶查詢,但性能差別很大。 第一種方式: 使用包含支持用戶查詢的主函數的額外測試文件編譯倒排索引。 文件:InvertedIndex.cpp UserQuery.cpp 編譯: g++ -g -Wall -O3 -fPIC -o textSearch1 InvertedI

    1熱度

    2回答

    solr使用倒排索引從索引的「條款」中查找文檔。 但我想知道的是 - 是否有任何方法知道所有涉及特定文件的術語? 謝謝

    0熱度

    2回答

    我創建了兩個索引時尚和手機與字段「名稱」。 client.indices.create(index='fashion',body={"mappings": {"doc": {"properties": {"name": {"type": "string"} } } } }) client.indices.create(index='mobiles',body={"mappings": {"doc