n-gram

    1熱度

    3回答

    我正在實施拼寫檢查器的變體。在採取各種路線(爲了提高時間效率)之後,我打算試用一個涉及使用n-gram模型的組件。所以基本上我想修剪可能的候選人列表進行進一步處理。你們會碰巧知道使用n的一個值(比如說2)是否會比其他的(比如說3)更好?

    16熱度

    2回答

    我想用n-gram(最好用PHP)實現一些應用程序。 哪種類型的n-gram更適合大多數用途?一個單詞級別還是一個字符級別的n-gram?你怎麼能在PHP中實現一個n-gram-tokenizer? 首先,我想知道N-gram究竟是什麼。它是否正確?這就是我對n-gram的理解: 句子:「我住在紐約。」 字級的雙字母組(2 N):「#我」, 「我住」, 「住」, 「在紐約」, '紐約#' 人物等級

    3熱度

    3回答

    我有一個Postgres後端的Rails應用程序。 我需要添加全文搜索,這將允許基於Levenshtein距離或其他類似指標的模糊搜索。添加詞法分析器/詞幹分析器必須處理非英語單詞的事實(只要在搜索時關閉語言相關功能就可以了,不要混淆目標語言,而英語引擎認爲這些詞語可能有意義的詞語是無關緊要的)。 我想,因爲它不具有模糊搜索Postgres的TSEARCH不會在這裏適用 - 請糾正我,如果我錯了。