我想查找一個單詞是否包含數字和字符,如果是這樣則將數字部分和字符部分分開。我想檢查泰米爾文字,例如:ரூ.100
或ரூ100
。我想分開ரூ.
和100
,ரூ
和100
。我如何在Python中做到這一點。我想是這樣的:確定該字符是否是python中某個單詞內的數字或Unicode字符
for word in f.read().strip().split():
for word1, word2, word3 in zip(word,word[1:],word[2:]):
if word1 == "ர" and word2 == "ூ " and word3.isdigit():
print word1
print word2
if word1.decode('utf-8') == unichr(0xbb0) and word2.decode('utf-8') == unichr(0xbc2):
print word1 print word2
你嘗試過什麼? –
我試着檢查第一個字符是否是ரூ,如果它後面跟着一個數字,但問題是我無法與unicode值匹配,則會引發錯誤。 – charvi
這是我試過的:對於word.word(1),word [2:])中的字1,字2,字3在f.read()。strip()。split(): \t: \t \t \t \t如果WORD1 == 「ர」 和單詞2 == 「ூ」: #,然後word3.isdigit(): \t \t \t \t \t打印WORD1 \t \t \t \t \t打印WORD2 \t \t \t \t如果word1.decode('utf-8')== unichr (0xbb0)和word2.decode( 'UTF-8')== unichr(0xbc2): \t \t \t \t \t打印WORD1 \t \t \t \t \t打印WORD2 – charvi