pylucene

    0熱度

    1回答

    我剛剛開始學習Lucene,並希望將其用於索引 硬盤驅動器和我的電子郵件,我想知道Lucene是否有幫助我的 或我必須建立某種觀察者,該款腕錶 任何變化的詮釋,他的硬盤 在討論:How do I watch a file for changes using Python? 感謝

    1熱度

    2回答

    我很好奇什麼是最好的方法來處理標記化/索引術語(在Lucene中)或任何搜索引擎,以便這些搜索匹配相應的術語。 「12」= 「十二條」 「MX1」= 「MX一個」 是否有任何內置的功能,我忽略了?

    1熱度

    1回答

    嗨我想將我的工作Django v1.3應用程序,使用從DJANGO開發服務器的Pylucene到Apache與mod_wsgi在哪裏它給出了一個錯誤Windows XP機器。從Django的調試 錯誤消息: ViewDoesNotExist at /administration/feeds/ Could not import plunk4.feeds.views. Error was: DLL l

    0熱度

    1回答

    我有一個關於lucene和apache的奇怪問題。我使用Lucene全文搜索和搜索我需要調用: initVM() 我發現,在這之後的呼叫沒有得到執行。所以這一切都發生在通過apache處理的http請求上。 現在,當我嘗試在交互式命令提示符下手動執行此操作時,它工作正常。 這些是以下一些relavent apache配置行: <IfModule prefork.c> StartServers

    1熱度

    1回答

    如何從lucene索引獲取在Document內用於Field的令牌(無論是令牌列表還是其他內容)?也就是說,是否有可能從索引獲取tokens(來自示例)中使用的令牌? (我不知道怎麼去標記出TokenStream)的 doc.add(new Field("title", tokens)) 在本文檔中有Field.tokenStreamValue()但是當我做doc.getFieldable(f

    3熱度

    1回答

    我對Lucene的Term Vectors非常陌生 - 並且希望確保收集的術語儘可能高效。 我得到了獨特的術語,然後檢索該術語的docFreq()以執行刻面。 我使用收集索引中的所有文件條款: lindex = SimpleFSDirectory(File(indexdir)) ireader = IndexReader.open(lindex, True) terms = ireader.t

    1熱度

    1回答

    我讀過關於在Lucene的突出的搜索字詞一些教程,並用一塊像這樣的代碼上來: (...) query = parser.parse(query_string) for scoreDoc in searcher.search(query, 50).scoreDocs: doc = searcher.doc(scoreDoc.doc) filename = doc.get("

    0熱度

    1回答

    最後我設法pylucene我的Windows7的機器上工作, 其中提出了一個更具普遍性的問題: 爲什麼,當我有在目錄中的DLL路徑,蟒蛇無法找到它, 當我把DLL在C:\ WINDOWS \ SYSTEM32 - 它的確工作? 使用Windows 7 32位

    1熱度

    2回答

    我正在嘗試使用PyLucene,而且我找不到任何實際運行在我當前版本中的代碼示例。 (例如,參見http://nullege.com/codes/search/PyLucene.StandardAnalyzer)。 在某些情況下,您需要實例化分析器。這似乎應該通過調用lucene.StandardAnalyzer()來完成。然而,這給出了一個錯誤: lucene.InvalidArgsError:

    1熱度

    1回答

    我試圖從Python序列構建TokenStream。 只是爲了好玩我希望能夠直接傳遞我自己的代幣 pylucene.Field("MyField", MyTokenStream) 我試圖讓「MyTokenStream」由... terms = ['pant', 'on', 'ground', 'look', 'like', 'fool'] stream = pylucene.PythonTo