最明顯的方法是使用同義詞爲:
$str1 = "Samsung Television 21 Inches LED BH005DE";
$str2 = "Samsung 21 Inch LED TV";
//synonyms:
$syns = [
'TV' => ['TV', 'Television'],
'Inch' => ['Inch', 'Inches']
];
//replace:
$str1 = array_reduce(array_keys($syns), function($c, $x) use ($syns)
{
return $c = preg_replace('/\b'.join('\b|\b', $syns[$x]).'\b/', $x, $c);
}, $str1);
//now, str1 looks like "Samsung TV 21 Inch LED BH005DE"
$str2 = array_reduce(array_keys($syns), function($c, $x) use ($syns)
{
return $c = preg_replace('/\b'.join('\b|\b', $syns[$x]).'\b/', $x, $c);
}, $str2);
//now, str2 looks like "Samsung 21 Inch LED TV"
$arr1 = explode(' ', $str1);
$arr2 = explode(' ', $str2);
//var_dump(array_diff($arr1, $arr2));//['BH005DE']
在你的情況,你可以不依賴於某種形式的字(像Inch
- Inches
) - 因爲你需要解析縮寫 - 這些都是具有特定含義的情況。因此,使用同義詞可能是解決所有案件的唯一方法。
預期結果是什麼?你究竟想達到什麼目的? –
@AmalMurali匹配電視和電視字詞 – Me7888
@Melody你在問不可能的事情,有很多帶有縮寫和簡短形式的單詞,系統應該如何識別它們?這不是你可以用一個或兩個函數解決的問題,用所有可能的場景(即不同格式的相同單詞)建立一個數據庫。 –