lemur

    1熱度

    1回答

    我無法使用Indri查詢語言編寫以下布爾查詢。我需要寫的查詢如下: (Stana or Katic) AND (Jon or Huertas) AND (co-stars or colleagues) 我需要包含上述所有文檔的列表。我怎麼能這樣做呢?

    2熱度

    1回答

    我成功使用Galago爲索引集索引。我沒有找到任何刪除索引的停用詞的參數。 Galago會自動刪除停用詞嗎?如果不是,我如何將停用詞列表傳遞給Galago,以及如何告訴Galago刪除停用詞?

    1熱度

    1回答

    我正在使用Galago檢索工具包(Lemur項目的一部分),我需要列出集合中所有詞彙術語(所有特殊術語)。其實我需要一個List <String>或Set <String>我真的很感激讓我知道如何獲得這樣的清單?

    2熱度

    1回答

    我已經開始使用Galago進行文檔檢索。我想使用LDA將一些文檔(最初用任何模型檢索的文檔)聚類。我更喜歡使用基於Java的實現,可以使用Galago將其集成到我的代碼中。如果您能讓我知道LDA的開源實現更適合我的用途,我將不勝感激。 非常感謝您的幫助!

    0熱度

    1回答

    我使用的是狐猴的自然語言處理的項目,我收錄的一些數據succesffully 我想通過IndriRunQuery命令 參數文件運行索引文件的查詢: <parameters> <index>PATH-TO-INDEX-DIRECTORY</index> <query> <number>1</number> <text>QUERY SAMPLE STRING</text> <

    0熱度

    1回答

    我想用Indri UI建立索引。我創建了用於構建索引的參數文件和停用詞列表。當我點擊構建索引時,UI會長時間建立,索引永遠不會建立。 UI掛在這裏, 這裏是我的input.txt的文件, <DOC> <DOCNO> @switcheery </DOCNO> <TEXT> Lol?"@elsidi01: "@switcheery: God bless that man that loves

    0熱度

    1回答

    我使用Python的編解碼器的一些UTF-8的文字寫在目錄中的文件 #-*-coding:utf-8-*- import codecs filename = 'afile' with codecs.open(filename, encoding='utf-8', mode='w') as fw : fw.write('<DOC>\n<DOCNO>') fw.write(

    0熱度

    1回答

    我試圖讓一個簡單的狐猴CGI啓動並運行,但是當我在瀏覽器中導航到lemur.cgi時,出現500服務器配置錯誤。 內部服務器錯誤 服務器遇到一個內部錯誤或配置錯誤,無法完成您的請求。 請聯繫服務器管理員root @ localhost並告知他們發生錯誤的時間以及可能導致錯誤的任何事情。 有關此錯誤的更多信息可能在服務器錯誤日誌中可用。 我通過在~/indri_test/param_files/中運