string-algorithm

    2熱度

    1回答

    我在網上發現了這個非常具有挑戰性的編碼問題,雖然我會試一試。 總的想法是,給定的文本字符串T和模式P,找到此模式的發生,總結它的相應值並返回最大值和最小值。如果您想更詳細地閱讀該問題,請參閱this。 然而,下面是我提供的代碼,它的工作原理進行了簡單的測試案例,但在多重複雜的測試用例,運行它很慢的時候,我不知道在哪裏需要優化我的代碼。 任何人都可以請幫助,即時通知邏輯錯誤。 public clas

    2熱度

    3回答

    爲了找到子串的位置,在一個字符串中,一個樸素的算法將花費O(n^2)時間。然而,使用一些高效的算法(如KMP algorithm),這可以在O(n)的時間來實現的: s = 'saurabh' w = 'au' def get_table(): i = 0; j = 2 t = [] t.append(-1); t.append(0) while i

    0熱度

    3回答

    我有一個字符串(你好這是一個字符串),我想在其中搜索關鍵字。我該怎麼做? 我要搜索以下關鍵字的字符串: 字符串:你好這是一個字符串。 關鍵詞: 1.你好這個(應該匹配) 2.你好(應匹配) 3.你好噸(應該不匹配) 4.你好這個我(應該不匹配) 請建議構建數據結構進行存儲和搜索的優化方法?

    -2熱度

    1回答

    我正在研究谷歌foobar上的這個問題。 「編寫一個名爲answer(document,searchTerms)的函數,它返回文檔中最短的片段,包含所有給定的搜索詞。搜索詞可以按任意順序出現。」 片段的長度是片段中的單詞的數量 我的解決方案在2個測試用例(他們不告訴你哪個)上失敗,我不確定我做錯了什麼。我測試了幾十種不同的場景,並且適用於其中的每一種場景。 文檔中的所有單詞都是空格分隔的,文檔中至

    3熱度

    4回答

    如果我有一個collection of strings是否有一個數據結構或函數可以提高檢查集合中的任何元素是否爲主串中的substrings ? 現在我正在循環訪問我的字符串數組並使用in運算符。有更快的方法嗎? import timing ## string match in first do_not_scan ## 0:00:00.029332 ## string not in do

    0熱度

    2回答

    我想找到一個人物的出現在N次查詢字符串: 例如字符串是:「i_love_mathematics」 和任務是找出發生: 「我」的範圍: 1-4(a substring starting from 1st character and ending at 4th) 2-5 3-10 在範圍 '_': 1-10 3-9 輸出將是: 1

    0熱度

    3回答

    我有這樣的一段簡單的代碼,告訴我,如果在給定列表中的單詞出現的一篇文章: if not any(word in article.text for word in keywords): print("Skipping article as there is no matching keyword\n") 我需要的是,如果文章中出現「關鍵字」列表中至少有3個單詞 - 如果它們不是那麼它

    -4熱度

    1回答

    我需要從給定的字符串數組中找到所有子字符串並對它們進行分組。 附加條件: 如果字符串S1包含字符串S2,S1包含S3,S2包含S4 - 所有這些應該是在一組。 實施例: 鑑於陣列: 你好,你好,約翰,HI,您好鮑勃,地獄,大家 結果輸出: 組1:您好,你好,約翰,地獄 第2組:你好,鮑勃,你好全部

    3熱度

    3回答

    我需要一種方法幫助我在另一個子字符串中查找字符串,換句話說,在其他字符串的子範圍內查找字符串。此外,我需要以相反的順序找到它,因爲我知道我正在查找的字符串被關閉到用作「haystack」的子字符串的末尾。 讓我們假設下面的一段代碼,其中rfind_in_substr是我所要求的方法: std::size_t pos = substr_beg + sample.substr (subs

    -1熱度

    1回答

    給定n個字符串,每個length <=10^5。 輸入:「aa ab ac ad」 輸出:8(「a」,」b」,」c」,」d」,」aa」,」ab」,」ac」,」ad」) 輸入:「aab bcd」 輸出:10(「a」,」b」,」c」,」d」,」aa」,」ab」,」bc」,」cd」,」aab」,」bcd」) 更新: スffix樹是一個解決方案,但它需要更多的內存。 除了後綴樹還有解決方案嗎? 我試過,但