text-search

    0熱度

    1回答

    在使用JavaScript通過window.find(text)(使用this SO post中的代碼)在WebView(Android)中進行文本搜索後,將成功顯示相應的文本。 不幸的是,我沒有成功找到刪除格式的代碼。我嘗試了各種方法(一些從StackOverflow)沒有成功,都不工作我認爲是正確的: document.designMode = 'on'; document.execComm

    0熱度

    1回答

    我有一個大的Apache Jena TDB,我想要使用Apache Jena 2.10.2構建一個Lucene索引以用於新的文本搜索功能。我發現文檔很難遵循。 我第一次嘗試在代碼中使用配置,但遇到依賴問題。 lecene-core和solr-solrj的任何組合都會導致某些'classNotFound'錯誤或'StandardAnalyzer重寫最終方法tokenStream'錯誤。代碼示例: D

    2熱度

    1回答

    我正在開發一個web應用程序,將需要下載的HTML形式的網站,然後遍歷代碼,並嘗試找到一個具體但不斷變化的價值(在我們的情況下,這將是產品的價格)。爲此,我在考慮要求用戶(在安裝和設置時)向系統提供頁面中的幾行HTML(具有價格),然後從那時起,每當我們需要獲取我們嘗試搜索這些產品線並查找價格的價格。 現在,我認爲這是一個可怕和緩慢的做法,因爲沒有規則,並且html可能完全不同於一個網站到另一個網

    0熱度

    1回答

    我可以有一個BooleanQuery其中有兩個其他查詢,一個SHOULD和一個MUST?我希望SHOULD查詢的類型爲ConstantScoreQuery,而另一個類型爲PhraseQuery。 我知道PhraseQuery實際上有助於總分,但ConstantScoreQuery不會貢獻。真的嗎? 如果ConstantScoreQuery與BooleanQuery中的其他類型的查詢一起出現,結果將

    0熱度

    1回答

    我在文檔上使用WildcardQuery,並且我看到結果文檔都是0.5。我讀過像WildcardQuery這樣的查詢不會影響文檔的評分,現在我想知道得分爲0.5的原因是什麼。 我用這簡單的查詢: WildcardQuery wq = new WildCardQuery("filed_name", "book");

    0熱度

    2回答

    我有業務需求,我們需要做的somce瘋狂的名稱匹配與存儲在數據庫中的記錄,我想知道是否有任何簡單的方法使用SQL Server來做到這一點。 在數據庫中存儲的名稱:奧斯汀ķ 名稱從UI匹配:克蘭德奧斯汀 這只是一個樣本。實際上,可能有很多不同的排列和組合。 如果是倒過來,我本可以用狂野性格,但在這種情況下,數據庫名稱是比搜索標準較小。 有什麼建議嗎?

    -3熱度

    2回答

    我想從整個句子中搜索電話號碼。它可以是任何具有像(122)221-2172或122-221-2172或(122)-221-2172這樣的模式的數字,在PHP的幫助下我不知道數字存在於句子的哪一部分或我可以使用substr。

    1熱度

    2回答

    當我用短語搜索「PH1 PH2」找到包含「PH1」或「PH2」文本。 String line = "ph1 ph2"; QueryParser parser = new QueryParser(Version.LUCENE_CURRENT, field, analyzer); Query query = parser.parse(line); 任何人都知道如何通過1)短語(「ph1 p

    2熱度

    2回答

    MongoDB似乎只做邏輯或文本查詢? 如果我想查找所有包含單詞('apple'或'orange'或'pear')的文檔,我可以執行以下操作。 db.collection.runCommand('text', {search: 'apple orange pear', limit: -1}) 但我怎麼找到包含的單詞(「蘋果」和「橙色」和「梨」)三無特定順序的所有文檔。 這可能嗎?

    3熱度

    1回答

    考慮一行150萬行,每行大約50-100個單詞的文本文件。 要查找包含字線,採用os.popen('grep -w word infile')似乎快於 for line in infile: if word in line: print line 一個要不然怎麼可以搜索在Python中的文本文件一個字?搜索這個大型的unindex文本文件的最快方法是什麼?