2011-12-15 16 views
5

基本上,如果兩個字符串就如我的數據庫中同我還希望能夠檢查在應用程序級別評估。例如,如果有人在搜索字段中輸入「bjork」,我希望PHP能夠像MySQL那樣將它與字符串「Bjork」匹配。如何效仿MySQLs utf8_general_ci整理在PHP中的字符串比較

我猜PHP沒有直接等價於MySQL的排序選項,最簡單的做法是編寫一個簡單的函數來轉換字符串,使用strtolower()使它們統一爲小寫和strstr ()用其對應的ASCII等效替換多字節字符。

那是一個準確的假設?是否有人使用傻瓜陣列作爲strstr()的第二個參數,以便按照各種MySQL排序規則(特別是針對當前需求,utf8_general_ci)來匹配字符串?或者,缺乏這些,我在哪裏可以找到關於MySQL中不同排序規則如何處理各種字符的文檔? (我什麼地方看到過,在某些排序規則SS被視爲S和別人的SS,例如,但它並沒有勾勒出每一個人物的評價。)

+0

可以運行mysql查詢並告訴mysql爲傳遞給它的字符串使用哪種排序規則,以便在mysql服務器上運行比較。可能不是很快,但會創造確切的行爲。 – hakre 2011-12-15 02:40:04

+0

我應該補充一點,效率是最重要的。 – Thor 2011-12-15 04:21:01

回答

0
+0

這很有趣。我不知道那是存在的。唉,我無法從文檔中找到哪些設置的行爲與MySQL相同。另外,我想我對能夠順應字符串更感興趣,例如,它可以將字符串與數組鍵進行比較。 – Thor 2011-12-19 01:15:51

3

下面是我一直使用的是什麼,但我還沒有測試它與MySQL的完全一致。

function collation_conform($string,$collation='utf8_general_ci') 
{ 

    if($collation === 'utf8_general_ci') 
    { 
     if(!is_string($string)) 
      return $string; 

     $string = strtr($string, array(
      'Š'=>'S', 'š'=>'s', 'Ð'=>'D', 'Ž'=>'Z', 'ž'=>'z', 'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A', 'Ä'=>'A', 
      'Å'=>'A', 'Æ'=>'A', 'Ç'=>'C', 'È'=>'E', 'É'=>'E', 'Ê'=>'E', 'Ë'=>'E', 'Ì'=>'I', 'Í'=>'I', 'Î'=>'I', 
      'Ï'=>'I', 'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O', 'Õ'=>'O', 'Ö'=>'O', 'Ø'=>'O', 'Ù'=>'U', 'Ú'=>'U', 
      'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y', 'Þ'=>'B', 'ß'=>'Ss','à'=>'a', 'á'=>'a', 'â'=>'a', 'ã'=>'a', 'ä'=>'a', 
      'å'=>'a', 'æ'=>'a', 'ç'=>'c', 'è'=>'e', 'é'=>'e', 'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i', 'î'=>'i', 
      'ï'=>'i', 'ð'=>'o', 'ñ'=>'n', 'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o', 'ö'=>'o', 'ø'=>'o', 'ù'=>'u', 
      'ú'=>'u', 'û'=>'u', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b', 'ÿ'=>'y', 'ƒ'=>'f')); 

     return strtolower($string); 
    } 
    else die('Unsupported Collation (collation_conform() collation_helper.php)'); 
} 
-1

請嘗試下面的代碼。

$s1 = 'Björk'; 
$s2 = 'bjork'; 

var_dump(
    is_same_string($s1, $s2) 
); 

function is_same_string($str, $str2, $locale = 'en_US') 
{ 
    $coll = collator_create($locale); 
    collator_set_strength($coll, Collator::PRIMARY); 
    return 0 === collator_compare($coll, $str, $str2); 
}