2016-06-09 102 views
2

我在這裏所描述的確切問題:從字符串中刪除Niqqud在JavaScript

removing Hebrew "niqqud" using r

一直在努力去除niqqud(用變音標誌代表元音或的字母替代的發音區別希伯來字母)。我有例如這個變量:sample1 < - 「הֻסְמַק」

而我找不到有效的方式來刪除字母下的標誌。

但在我的情況下,我必須在javascript中執行此操作。

根據描述的UTF-8值表here,我試過這regex沒有成功。

回答

4

只是你的正則表達式的一個小問題。請嘗試以下操作:

const input = "הֻסְמַק"; 
console.log(input) 
console.log(input.replace(/[\u0591-\u05C7]/g, '')); 

/* 
$ node index.js 
הֻסְמַק 
הסמק 
*/ 
+0

文本中存在Maqaf('u5BE')問題。它被刪除,並且兩個單詞連接在一起。例如_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ – Avraham