2012-12-07 69 views
0

最近,我想到了一個想法,即是否可以使用C#來識別希伯來語中的單詞的標點符號。 有在希伯來語幾個標點符號,如:在希伯來語中標識標點符號的方法? C#

יוּעָדוּ 

當然,通常我們不圈點的話,那麼它應該出現這樣的:

יועדו 

有沒有一種方法,以確定這個使用C#的單詞的標點符號?

+0

你是否在尋找比字符串比較和匹配更多的東西? – ryadavilli

+1

您可以使用正則表達式並搜索標點符號,但我相信您已經知道這一點。你嘗試過什麼不起作用? –

+0

@ryadavilli - 我正在尋找的是一個可以識別單詞標點符號的單詞。例如,我在我的文章中寫道,我希望C#程序能夠識別標點符號和標點符號本身。我希望你現在能更好地理解我的問題。 –

回答

1

在Python中,序列分析如下:(我已經添加空格讓事情更清晰)

>>> a = unicode('יוּעָדוּ', 'utf-8') 
>>> b = unicode('יועדו', 'utf-8') 
>>> a 
u'\u05d9\u05d5\u05bc\u05e2\u05b8\u05d3\u05d5\u05bc' 
>>> b 
u'\u05d9\u05d5  \u05e2  \u05d3\u05d5' 

你可以看到標點令牌中脫穎而出很清楚。尋找這些的C#正則表達式可能是你想要去的方向。