我正在尋找我正在實施的兩個功能的新想法。分割和搭配
1)文字分割特徵:搭配
Ex:
User Query: Resolved Query:
----------- ---------------
It has lotsofwordstogether It has lots of words together
I am using normal recursion or DP solution using unigrams probability.
2)種類:
Ex:
User Query: Resolved Query:
---------- ---------------
I like t shirts in Wal mart I like t-shirts in Walmart
不知道該怎麼辦了這一點。我現在唯一的想法是將這個句子標記出來,並將非有意義的記號與先前的記號或下一個記號結合起來形成可以對照單詞進行檢查的單詞。
這些解決方案對我的要求很慢(特別是第一個)。 我想一起使用這些功能。尋找更好的想法。
我是這個領域的新手。你可以在這裏指出一些書籍或在線來源。如何使用字母n-gram解決t恤問題? – starkk92