想象一個包含UTF-8中幾個單詞的任何給定語言(英語,阿拉伯語,日語等)的標題字符串。例如:如何將漂亮的頁面標題轉換爲有效的URL字符串?
$stringRAW = "Blues & μπλουζ Bliss's ブルース Schön";
現在,這實際上需要轉換到的東西多數民衆的頁面的URL的有效部:
$stringURL = "blues-μπλουζ-bliss-ブルース-schön"
just check out this link 這工作我的服務器上呢!
Q1。哪些字符最近被允許作爲有效的URL?我記得在瀏覽器中看到過阿拉伯字符串,我在apache 2上測試過它,並且一切正常。
我guesse它必須成爲:
$stringURL = "blues-blows-bliss-black"
Q2。你知道哪些現有的php函數能夠正確地對這些UTF-8字符串進行編碼/轉換,以將URL從任何無效字符中剝離出來?
我guesse至少有:1。 空間應該被轉換爲破折號
-
2.刪除無效字符?這是他們? @
和'&'?
3.將所有字母轉換爲小寫(或首字母縮寫字母在網址中有效嗎?)
感謝:您的建議非常感謝!
強烈的相關:http://stackoverflow.com/questions/465990/how-to-handle-diacritics-accents-when-rewriting-pretty-urls – 2011-03-07 16:28:56
'(將任何無效的東西,如'或&空格)' - 這些在技術上不是無效的。他們只需通過'urlencode'編碼 – 2011-03-07 16:51:11
真棒鏈接Pekka! +1這是一個質量的鏈接,特別是在外國的字符問題 – Sam 2011-03-07 16:55:08