我期待將帶有重音符號(例如:Nínhǎo)的拼音轉換爲以數字/ ASCII形式(例如:Nin2 hao1)書寫的拼音。將帶有口音的漢語拼音轉換爲數字形式
有沒有人知道任何圖書館,最好是PHP?或者熟悉中文/拼音足以發表評論?
我開始自己寫一篇比較簡單的文章,但我不會說中文,也不完全理解單詞分隔時應該怎樣劃分的規則。
我能寫,其轉換譯者:
Nín hǎo. Wǒ shì zhōng guó rén
==>Nin2 hao3. Wo3 shi4 zhong1 guo2 ren2
但你如何處理的話像下面這樣 - 他們得到了空間分成多個單詞,或你插嘴的字中的音色編號(如果有,在哪裏?): huā shíjiān
,wèishénme
,yuèláiyuè
,shēngbìng
等
我希望我能+2這個關於歧義的解釋。 – erjiang 2010-11-11 03:42:19
所以你會說,首先尋找最長的音節,貪婪,如在這裏找到:http://pinyin.info/rules/initials_finals.html?那麼這對我提供的示例輸入是否正確(假設沒有歧義)? 'hua1 shi2jian1','wei4shen2me5','yue4lai2yue4'和'sheng1bing4' - 基本上,在列出的每個「音節」之間注入數字,並保持原來的間距? – philfreo 2010-11-11 20:21:49
長安在拼音中是專門爲解決歧義寫成的。 – cababunga 2010-11-11 21:10:42